R Language
रैंडम फ़ॉरेस्ट एल्गोरिथम
खोज…
परिचय
RandomForest वर्गीकरण या प्रतिगमन के लिए एक पहनावा तरीका है जो डेटा को ओवरफिट करने की संभावना को कम करता है। विधि का विवरण रैंडम फॉरेस्ट पर विकिपीडिया लेख में पाया जा सकता है। R के लिए मुख्य कार्यान्वयन रैंडम फॉरेस्ट पैकेज में है, लेकिन अन्य कार्यान्वयन भी हैं। मशीन लर्निंग पर CRAN देखें ।
मूल उदाहरण - वर्गीकरण और प्रतिगमन
###### Used for both Classification and Regression examples
library(randomForest)
library(car) ## For the Soils data
data(Soils)
######################################################
## RF Classification Example
set.seed(656) ## for reproducibility
S_RF_Class = randomForest(Gp ~ ., data=Soils[,c(4,6:14)])
Gp_RF = predict(S_RF_Class, Soils[,6:14])
length(which(Gp_RF != Soils$Gp)) ## No Errors
## Naive Bayes for comparison
library(e1071)
S_NB = naiveBayes(Soils[,6:14], Soils[,4])
Gp_NB = predict(S_NB, Soils[,6:14], type="class")
length(which(Gp_NB != Soils$Gp)) ## 6 Errors
यह उदाहरण प्रशिक्षण डेटा पर परीक्षण किया गया है, लेकिन यह दर्शाता है कि आरएफ बहुत अच्छे मॉडल बना सकता है।
######################################################
## RF Regression Example
set.seed(656) ## for reproducibility
S_RF_Reg = randomForest(pH ~ ., data=Soils[,6:14])
pH_RF = predict(S_RF_Reg, Soils[,6:14])
## Compare Predictions with Actual values for RF and Linear Model
S_LM = lm(pH ~ ., data=Soils[,6:14])
pH_LM = predict(S_LM, Soils[,6:14])
par(mfrow=c(1,2))
plot(Soils$pH, pH_RF, pch=20, ylab="Predicted", main="Random Forest")
abline(0,1)
plot(Soils$pH, pH_LM, pch=20, ylab="Predicted", main="Linear Model")
abline(0,1)
Modified text is an extract of the original Stack Overflow Documentation
के तहत लाइसेंस प्राप्त है CC BY-SA 3.0
से संबद्ध नहीं है Stack Overflow