Sök…


Grundläggande användning av aov ()

Variansanalys (aov) används för att bestämma om medel för två eller flera grupper skiljer sig väsentligt från varandra. Svaren antas vara oberoende av varandra, vanligtvis distribuerade (inom varje grupp) och avvikelserna inom gruppen antas lika.

För att slutföra analysen måste uppgifterna vara i långt format (se omformning av dataämne). aov() är ett omslag runt lm() -funktionen, med Wilkinson-Rogers formelnotation y~f där y är svar (oberoende) variabel och f är en faktor (kategorisk) variabel som representerar gruppmedlemskap. Om f är numeriskt snarare än en aov() , kommer aov() att rapportera resultaten av en linjär regression i ANOVA-format, vilket kan överraska oerfarna användare.

aov() använder typ I (sekventiell) Sum av kvadrater. Denna typ av summan av kvadrater testar alla (huvud- och interaktion) -effekter i följd. Resultatet är att den första testade effekten också tilldelas delad varians mellan den och andra effekter i modellen. För att resultaten från en sådan modell ska vara tillförlitliga bör data balanseras (alla grupper har samma storlek).

När antagandena för kvadrater av typ I-summan inte rymmer, kan kvadrater av typ II eller typ III vara tillämpliga. Typ II Sumkvadrater testar varje huvudeffekt efter varje annan huvudeffekt och kontrollerar därmed för överlappande varians. Typ II Sum of Squares antar dock ingen interaktion mellan huvudeffekterna.

Slutligen testar typ III Summar av kvadrater varje huvudeffekt efter varje annan huvudeffekt och varje interaktion. Detta gör typ III Sumkvadrater till en nödvändighet när en interaktion är närvarande.

Typ II och Type III Sums of Squares implementeras i Anova() -funktionen.


Använda mtcars som ett exempel.

mtCarsAnovaModel <- aov(wt ~ factor(cyl), data=mtcars)

För att se en sammanfattning av ANOVA-modellen:

summary(mtCarsAnovaModel)

Man kan också extrahera koefficienterna för den underliggande lm() -modellen:

coefficients(mtCarsAnovaModel)

Grundläggande användning av Anova ()

När man hanterar en obalanserad design och / eller icke-ortogonala kontraster, är typ II eller III summan av kvadrater nödvändig. Den Anova() funktion från car paketet implementerar dessa. Typ II Sum of Squares förutsätter ingen interaktion mellan huvudeffekter. Om interaktioner antas är typ III summan av rutorna lämplig.

Funktionen Anova() sveper runt lm() -funktionen.


Använda mtcars som ett exempel och visar skillnaden mellan typ II och typ III när en interaktion testas.

> Anova(lm(wt ~ factor(cyl)*factor(am), data=mtcars), type = 2)
Anova Table (Type II tests)

Response: wt
                       Sum Sq Df F value    Pr(>F)    
factor(cyl)            7.2278  2 11.5266 0.0002606 ***
factor(am)             3.2845  1 10.4758 0.0032895 ** 
factor(cyl):factor(am) 0.0668  2  0.1065 0.8993714    
Residuals              8.1517 26                      
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

> Anova(lm(wt ~ factor(cyl)*factor(am), data=mtcars), type = 3)
Anova Table (Type III tests)

Response: wt
                        Sum Sq Df F value    Pr(>F)    
(Intercept)            25.8427  1 82.4254 1.524e-09 ***
factor(cyl)             4.0124  2  6.3988  0.005498 ** 
factor(am)              1.7389  1  5.5463  0.026346 *  
factor(cyl):factor(am)  0.0668  2  0.1065  0.899371    
Residuals               8.1517 26                      
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1


Modified text is an extract of the original Stack Overflow Documentation
Licensierat under CC BY-SA 3.0
Inte anslutet till Stack Overflow