R Language
कैरट
खोज…
परिचय
caret
एक आर पैकेज है जो मशीन प्रसंस्करण में सहायता करता है जो मशीन सीखने की समस्याओं के लिए आवश्यक है। यह वर्गीकरण और प्रतिगमन प्रशिक्षण के लिए है। वास्तविक डेटासेट के लिए मॉडल बनाते समय, वास्तविक लर्निंग एल्गोरिथम के अलावा कुछ कार्य होते हैं, जिन्हें करने की आवश्यकता होती है, जैसे डेटा को साफ़ करना, अपूर्ण टिप्पणियों से निपटना, हमारे मॉडल को एक परीक्षण सेट पर मान्य करना और विभिन्न मॉडलों की तुलना करना।
caret
इन परिदृश्यों में मदद करता है, उपयोग किए गए वास्तविक शिक्षण एल्गोरिदम से स्वतंत्र।
preprocessing
कैरेट में प्री-प्रोसेसिंग preProcess()
फ़ंक्शन के माध्यम से किया जाता है। एक मैट्रिक्स या डेटा फ़्रेम प्रकार ऑब्जेक्ट x
को देखते हुए, preProcess()
प्रशिक्षण डेटा पर परिवर्तन लागू करता है जिसे तब परीक्षण डेटा पर लागू किया जा सकता है।
preProcess()
फ़ंक्शन का दिल method
तर्क है। इस क्रम में विधि संचालन लागू होते हैं:
- शून्य-विचरण फ़िल्टर
- निकट-शून्य विचरण फ़िल्टर
- बॉक्स-कॉक्स / येओ-जॉनसन / घातीय परिवर्तन
- केंद्रित
- स्केलिंग
- रेंज
- इलज़ाम
- पीसीए
- आईसीए
- स्थानिक संकेत
नीचे, हम mtcars डेटा सेट लेते हैं और केंद्र, स्केलिंग और एक स्थानिक साइन ट्रांसफॉर्म करते हैं।
auto_index <- createDataPartition(mtcars$mpg, p = .8,
list = FALSE,
times = 1)
mt_train <- mtcars[auto_index,]
mt_test <- mtcars[-auto_index,]
process_mtcars <- preProcess(mt_train, method = c("center","scale","spatialSign"))
mtcars_train_transf <- predict(process_mtcars, mt_train)
mtcars_test_tranf <- predict(process_mtcars,mt_test)