खोज…


परिचय

caret एक आर पैकेज है जो मशीन प्रसंस्करण में सहायता करता है जो मशीन सीखने की समस्याओं के लिए आवश्यक है। यह वर्गीकरण और प्रतिगमन प्रशिक्षण के लिए है। वास्तविक डेटासेट के लिए मॉडल बनाते समय, वास्तविक लर्निंग एल्गोरिथम के अलावा कुछ कार्य होते हैं, जिन्हें करने की आवश्यकता होती है, जैसे डेटा को साफ़ करना, अपूर्ण टिप्पणियों से निपटना, हमारे मॉडल को एक परीक्षण सेट पर मान्य करना और विभिन्न मॉडलों की तुलना करना।

caret इन परिदृश्यों में मदद करता है, उपयोग किए गए वास्तविक शिक्षण एल्गोरिदम से स्वतंत्र।

preprocessing

कैरेट में प्री-प्रोसेसिंग preProcess() फ़ंक्शन के माध्यम से किया जाता है। एक मैट्रिक्स या डेटा फ़्रेम प्रकार ऑब्जेक्ट x को देखते हुए, preProcess() प्रशिक्षण डेटा पर परिवर्तन लागू करता है जिसे तब परीक्षण डेटा पर लागू किया जा सकता है।

preProcess() फ़ंक्शन का दिल method तर्क है। इस क्रम में विधि संचालन लागू होते हैं:

  1. शून्य-विचरण फ़िल्टर
  2. निकट-शून्य विचरण फ़िल्टर
  3. बॉक्स-कॉक्स / येओ-जॉनसन / घातीय परिवर्तन
  4. केंद्रित
  5. स्केलिंग
  6. रेंज
  7. इलज़ाम
  8. पीसीए
  9. आईसीए
  10. स्थानिक संकेत

नीचे, हम mtcars डेटा सेट लेते हैं और केंद्र, स्केलिंग और एक स्थानिक साइन ट्रांसफॉर्म करते हैं।

auto_index <- createDataPartition(mtcars$mpg, p = .8,
                                  list = FALSE,
                                  times = 1)

mt_train <- mtcars[auto_index,]
mt_test <- mtcars[-auto_index,]

process_mtcars <- preProcess(mt_train, method = c("center","scale","spatialSign"))

mtcars_train_transf <- predict(process_mtcars, mt_train)
mtcars_test_tranf <- predict(process_mtcars,mt_test)


Modified text is an extract of the original Stack Overflow Documentation
के तहत लाइसेंस प्राप्त है CC BY-SA 3.0
से संबद्ध नहीं है Stack Overflow