R Language
ANOVA
Buscar..
Uso básico de aov ()
El análisis de varianza (aov) se utiliza para determinar si las medias de dos o más grupos difieren significativamente entre sí. Se supone que las respuestas son independientes entre sí, normalmente distribuidas (dentro de cada grupo), y las desviaciones dentro del grupo se suponen iguales.
Para completar el análisis, los datos deben estar en formato largo (consulte el tema de remodelación de datos ). aov()
es una envoltura alrededor de la función lm()
, que utiliza la notación de fórmula de Wilkinson-Rogers y~f
donde y
es la variable de respuesta (independiente) f
es una variable factorial (categórica) que representa la pertenencia al grupo. Si f
es numérica en lugar de una variable factorial, aov()
informará los resultados de una regresión lineal en formato ANOVA, lo que puede sorprender a los usuarios inexpertos.
La función aov()
usa la suma de cuadrados tipo I (secuencial). Este tipo de Suma de cuadrados prueba todos los efectos (principales y de interacción) secuencialmente. El resultado es que al primer efecto probado también se le asigna una variación compartida entre este y otros efectos en el modelo. Para que los resultados de dicho modelo sean confiables, los datos deben estar equilibrados (todos los grupos son del mismo tamaño).
Cuando las suposiciones para la suma de cuadrados tipo I no se cumplen, la suma de cuadrados tipo II o tipo III puede ser aplicable. La suma de cuadrados del tipo II prueba cada efecto principal después de cada otro efecto principal, y por lo tanto controla cualquier variación superpuesta. Sin embargo, la suma de cuadrados tipo II no asume ninguna interacción entre los efectos principales.
Por último, la suma de cuadrados tipo III prueba cada efecto principal después de cada otro efecto principal y cada interacción. Esto hace que la suma de cuadrados tipo III sea una necesidad cuando hay una interacción presente.
Las sumas de cuadrados Tipo II y Tipo III se implementan en la función Anova()
.
Usando el mtcars
datos mtcars
como ejemplo.
mtCarsAnovaModel <- aov(wt ~ factor(cyl), data=mtcars)
Para ver el resumen del modelo ANOVA:
summary(mtCarsAnovaModel)
También se pueden extraer los coeficientes del modelo subyacente lm()
:
coefficients(mtCarsAnovaModel)
Uso básico de Anova ()
Cuando se trata de un diseño desequilibrado y / o contrastes no ortogonales, la suma de cuadrados Tipo II o Tipo III es necesaria. La función Anova()
del paquete de car
implementa estos. La suma de cuadrados tipo II no asume ninguna interacción entre los efectos principales. Si se asumen interacciones, la suma de cuadrados tipo III es apropiada.
La función Anova()
ajusta a la función lm()
.
Usando los mtcars
datos de mtcars
como ejemplo, demostrando la diferencia entre el Tipo II y el Tipo III cuando se prueba una interacción.
> Anova(lm(wt ~ factor(cyl)*factor(am), data=mtcars), type = 2)
Anova Table (Type II tests)
Response: wt
Sum Sq Df F value Pr(>F)
factor(cyl) 7.2278 2 11.5266 0.0002606 ***
factor(am) 3.2845 1 10.4758 0.0032895 **
factor(cyl):factor(am) 0.0668 2 0.1065 0.8993714
Residuals 8.1517 26
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> Anova(lm(wt ~ factor(cyl)*factor(am), data=mtcars), type = 3)
Anova Table (Type III tests)
Response: wt
Sum Sq Df F value Pr(>F)
(Intercept) 25.8427 1 82.4254 1.524e-09 ***
factor(cyl) 4.0124 2 6.3988 0.005498 **
factor(am) 1.7389 1 5.5463 0.026346 *
factor(cyl):factor(am) 0.0668 2 0.1065 0.899371
Residuals 8.1517 26
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1