R Language
ANOVA
Recherche…
Utilisation de base de aov ()
L'analyse de la variance (aov) est utilisée pour déterminer si les moyennes de deux groupes ou plus diffèrent de manière significative les unes des autres. Les réponses sont supposées être indépendantes les unes des autres, normalement distribuées (dans chaque groupe), et les variances intra-groupe sont supposées égales.
Pour compléter l'analyse, les données doivent être au format long (voir la rubrique sur le remodelage des données ). aov()
est un wrapper autour de la fonction lm()
, utilisant la notation de formule Wilkinson-Rogers y~f
où y
est la variable de réponse (indépendante) et f
est une variable factorielle (catégorielle) représentant l'appartenance à un groupe. Si f
est une variable numérique plutôt qu'une variable factorielle, aov()
rapportera les résultats d'une régression linéaire au format ANOVA, ce qui pourrait surprendre les utilisateurs inexpérimentés.
La fonction aov()
utilise la somme des carrés de type I (séquentielle). Ce type de somme de carrés teste séquentiellement tous les effets (principaux et d’interaction). Le résultat est que le premier effet testé se voit également attribuer une variance partagée entre celui-ci et les autres effets du modèle. Pour que les résultats d'un tel modèle soient fiables, les données doivent être équilibrées (tous les groupes ont la même taille).
Lorsque les hypothèses pour la somme des carrés de type I ne sont pas respectées, la somme des carrés de type II ou de type III peut être applicable. Type II La somme des carrés teste chaque effet principal après chaque autre effet principal, et contrôle donc les écarts éventuels. Cependant, la somme des carrés de type II ne suppose aucune interaction entre les effets principaux.
Enfin, la somme des carrés de type III teste chaque effet principal après chaque effet principal et chaque interaction. Cela fait de la somme des carrés de type III une nécessité lorsqu'une interaction est présente.
Les sommes de carrés de type II et de type III sont implémentées dans la fonction Anova()
.
En utilisant le mtcars
données mtcars
comme exemple.
mtCarsAnovaModel <- aov(wt ~ factor(cyl), data=mtcars)
Pour afficher le résumé du modèle ANOVA:
summary(mtCarsAnovaModel)
On peut également extraire les coefficients du modèle lm()
sous-jacent:
coefficients(mtCarsAnovaModel)
Utilisation de base d'Anova ()
En cas de conception déséquilibrée et / ou de contrastes non orthogonaux, la somme des carrés de type II ou de type III est nécessaire. La fonction Anova()
du package de car
les implémente. Type II La somme des carrés ne suppose aucune interaction entre les effets principaux. Si des interactions sont supposées, la somme des carrés de type III est appropriée.
La fonction Anova()
entoure la fonction lm()
.
En utilisant les mtcars
données mtcars
comme exemple, démontrant la différence entre le type II et le type III lorsqu'une interaction est testée.
> Anova(lm(wt ~ factor(cyl)*factor(am), data=mtcars), type = 2)
Anova Table (Type II tests)
Response: wt
Sum Sq Df F value Pr(>F)
factor(cyl) 7.2278 2 11.5266 0.0002606 ***
factor(am) 3.2845 1 10.4758 0.0032895 **
factor(cyl):factor(am) 0.0668 2 0.1065 0.8993714
Residuals 8.1517 26
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> Anova(lm(wt ~ factor(cyl)*factor(am), data=mtcars), type = 3)
Anova Table (Type III tests)
Response: wt
Sum Sq Df F value Pr(>F)
(Intercept) 25.8427 1 82.4254 1.524e-09 ***
factor(cyl) 4.0124 2 6.3988 0.005498 **
factor(am) 1.7389 1 5.5463 0.026346 *
factor(cyl):factor(am) 0.0668 2 0.1065 0.899371
Residuals 8.1517 26
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1