R Language
ANOVA
Поиск…
Основное использование aov ()
Анализ дисперсии (aov) используется для определения того, отличаются ли средства двух или более групп друг от друга. Ответы считаются независимыми друг от друга, обычно распределяются (внутри каждой группы), а внутригрупповые отклонения принимаются равными.
Для завершения анализа данные должны быть в длинном формате (см. Раздел «Изменение темы данных» ). aov()
является оберткой вокруг функции lm()
, используя формулу формулы Уилкинсона-Роджерса y~f
где y
- отклик (независимая) переменная, а f
- факторная (категориальная) переменная, представляющая членство в группе. Если f
является числовой, а не факторной переменной, aov()
будет сообщать результаты линейной регрессии в формате ANOVA, что может удивить неопытных пользователей.
Функция aov()
использует Type I (последовательный) Sum of Squares. Этот тип суммы квадратов проверяет все (основные и взаимодействующие) эффекты последовательно. В результате первым проверенным эффектом также назначается общая дисперсия между ним и другими эффектами в модели. Чтобы результаты такой модели были надежными, данные должны быть сбалансированы (все группы имеют одинаковый размер).
Если предположения для суммы квадратов типа I не выполняются, могут применяться классы типа II или типа III. Тип II Сумма квадратов проверяет каждый основной эффект после каждого другого основного эффекта и, таким образом, контролирует любую перекрывающуюся дисперсию. Однако Type II Sum of Squares не предполагает взаимодействия между основными эффектами.
Наконец, Type III Sum of Squares проверяет каждый основной эффект после каждого другого основного эффекта и каждого взаимодействия. Это делает Type III Sum of Squares необходимостью при наличии взаимодействия.
Совокупность квадратов типа II и типа III реализована в функции Anova()
.
В качестве mtcars
набор данных mtcars
.
mtCarsAnovaModel <- aov(wt ~ factor(cyl), data=mtcars)
Чтобы просмотреть сводку модели ANOVA:
summary(mtCarsAnovaModel)
Можно также извлечь коэффициенты базовой модели lm()
:
coefficients(mtCarsAnovaModel)
Основное использование Anova ()
При работе с неуравновешенным дизайном и / или неортогональными контрастами необходимо указать сумму квадратов типа II или типа III. Функция Anova()
из пакета car
реализует их. Тип II Сумма квадратов не предполагает взаимодействия между основными эффектами. Если предполагается взаимодействие, то подходит тип III квадратов квадратов.
Функция Anova()
обтекает функцию lm()
.
Используя mtcars
данных mtcars
в качестве примера, демонстрируя разницу между типом II и типом III при тестировании взаимодействия.
> Anova(lm(wt ~ factor(cyl)*factor(am), data=mtcars), type = 2)
Anova Table (Type II tests)
Response: wt
Sum Sq Df F value Pr(>F)
factor(cyl) 7.2278 2 11.5266 0.0002606 ***
factor(am) 3.2845 1 10.4758 0.0032895 **
factor(cyl):factor(am) 0.0668 2 0.1065 0.8993714
Residuals 8.1517 26
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> Anova(lm(wt ~ factor(cyl)*factor(am), data=mtcars), type = 3)
Anova Table (Type III tests)
Response: wt
Sum Sq Df F value Pr(>F)
(Intercept) 25.8427 1 82.4254 1.524e-09 ***
factor(cyl) 4.0124 2 6.3988 0.005498 **
factor(am) 1.7389 1 5.5463 0.026346 *
factor(cyl):factor(am) 0.0668 2 0.1065 0.899371
Residuals 8.1517 26
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1