खोज…


परिचय

RandomForest वर्गीकरण या प्रतिगमन के लिए एक पहनावा तरीका है जो डेटा को ओवरफिट करने की संभावना को कम करता है। विधि का विवरण रैंडम फॉरेस्ट पर विकिपीडिया लेख में पाया जा सकता है। R के लिए मुख्य कार्यान्वयन रैंडम फॉरेस्ट पैकेज में है, लेकिन अन्य कार्यान्वयन भी हैं। मशीन लर्निंग पर CRAN देखें

मूल उदाहरण - वर्गीकरण और प्रतिगमन

    ######  Used for both Classification and Regression examples
    library(randomForest)
    library(car)            ## For the Soils data
    data(Soils)
    
    ######################################################
    ##    RF Classification Example
    set.seed(656)            ## for reproducibility
    S_RF_Class = randomForest(Gp ~ ., data=Soils[,c(4,6:14)])
    Gp_RF = predict(S_RF_Class, Soils[,6:14])
    length(which(Gp_RF != Soils$Gp))            ## No Errors

    ## Naive Bayes for comparison
    library(e1071)
    S_NB  = naiveBayes(Soils[,6:14], Soils[,4]) 
    Gp_NB = predict(S_NB, Soils[,6:14], type="class")
    length(which(Gp_NB != Soils$Gp))            ## 6 Errors

यह उदाहरण प्रशिक्षण डेटा पर परीक्षण किया गया है, लेकिन यह दर्शाता है कि आरएफ बहुत अच्छे मॉडल बना सकता है।

    ######################################################
    ##    RF Regression Example
    set.seed(656)            ## for reproducibility
    S_RF_Reg = randomForest(pH ~ ., data=Soils[,6:14])
    pH_RF = predict(S_RF_Reg, Soils[,6:14])

    ## Compare Predictions with Actual values for RF and Linear Model
    S_LM = lm(pH ~ ., data=Soils[,6:14])
    pH_LM = predict(S_LM, Soils[,6:14])
    par(mfrow=c(1,2))
    plot(Soils$pH, pH_RF, pch=20, ylab="Predicted", main="Random Forest")
    abline(0,1)
    plot(Soils$pH, pH_LM, pch=20, ylab="Predicted", main="Linear Model")
    abline(0,1)

आरएफ और रैखिक मॉडल के लिए वास्तविक मूल्य बनाम मूल्य



Modified text is an extract of the original Stack Overflow Documentation
के तहत लाइसेंस प्राप्त है CC BY-SA 3.0
से संबद्ध नहीं है Stack Overflow