Szukaj…


Podstawowe użycie aov ()

Analiza wariancji (aov) służy do ustalenia, czy średnie dwóch lub więcej grup znacznie się od siebie różnią. Przyjmuje się, że odpowiedzi są od siebie niezależne, normalnie rozmieszczone (w obrębie każdej grupy), a wariancje wewnątrz grupy są równe.

Aby zakończyć analizę, dane muszą być w długim formacie (patrz temat dotyczący przekształcania danych ). aov() jest opakowaniem wokół funkcji lm() , wykorzystując zapis formuły Wilkinsona-Rogersa y~f gdzie y jest zmienną odpowiedzi (niezależną) f jest zmienną czynnikową (kategoryczną) reprezentującą członkostwo w grupie. Jeśli f jest liczbową, a nie zmienną czynnikową, aov() zgłosi wyniki regresji liniowej w formacie ANOVA, co może zaskoczyć niedoświadczonych użytkowników.

Funkcja aov() wykorzystuje aov() typu I (sekwencyjną). Ten typ sumy kwadratów testuje kolejno wszystkie efekty (główne i interakcyjne). W wyniku tego do pierwszego testowanego efektu przypisywana jest również wspólna wariancja między nim a innymi efektami w modelu. Aby wyniki z takiego modelu były wiarygodne, dane powinny być zrównoważone (wszystkie grupy mają ten sam rozmiar).

Jeżeli założenia dotyczące sumy kwadratów typu I nie mają zastosowania, zastosowanie może mieć suma kwadratów typu II lub typu III. Suma kwadratów typu II testuje każdy efekt główny po każdym innym efekcie głównym, a tym samym kontroluje każdą nakładającą się wariancję. Jednak suma kwadratów typu II zakłada brak interakcji między głównymi efektami.

Wreszcie suma kwadratów typu III testuje każdy efekt główny po każdym innym działaniu głównym i każdej interakcji. To sprawia, że suma kwadratów typu III jest koniecznością, gdy występuje interakcja.

Sumy kwadratów typu II i III są zaimplementowane w funkcji Anova() .


mtcars zestaw danych mtcars .

mtCarsAnovaModel <- aov(wt ~ factor(cyl), data=mtcars)

Aby wyświetlić podsumowanie modelu ANOVA:

summary(mtCarsAnovaModel)

Można również wyodrębnić współczynniki podstawowego modelu lm() :

coefficients(mtCarsAnovaModel)

Podstawowe użycie Anova ()

W przypadku niezrównoważonego projektu i / lub kontrastów nieortogonalnych konieczna jest suma kwadratów typu II lub typu III. Implementuje je funkcja Anova() z pakietu car . Suma kwadratów typu II zakłada brak interakcji między głównymi efektami. Jeśli zakłada się interakcje, odpowiednia jest suma kwadratów typu III.

Funkcja Anova() funkcję lm() .


Wykorzystując zestawy danych mtcars jako przykład, demonstrując różnicę między typem II a typem III podczas testowania interakcji.

> Anova(lm(wt ~ factor(cyl)*factor(am), data=mtcars), type = 2)
Anova Table (Type II tests)

Response: wt
                       Sum Sq Df F value    Pr(>F)    
factor(cyl)            7.2278  2 11.5266 0.0002606 ***
factor(am)             3.2845  1 10.4758 0.0032895 ** 
factor(cyl):factor(am) 0.0668  2  0.1065 0.8993714    
Residuals              8.1517 26                      
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

> Anova(lm(wt ~ factor(cyl)*factor(am), data=mtcars), type = 3)
Anova Table (Type III tests)

Response: wt
                        Sum Sq Df F value    Pr(>F)    
(Intercept)            25.8427  1 82.4254 1.524e-09 ***
factor(cyl)             4.0124  2  6.3988  0.005498 ** 
factor(am)              1.7389  1  5.5463  0.026346 *  
factor(cyl):factor(am)  0.0668  2  0.1065  0.899371    
Residuals               8.1517 26                      
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1


Modified text is an extract of the original Stack Overflow Documentation
Licencjonowany na podstawie CC BY-SA 3.0
Nie związany z Stack Overflow