
,

,
где

и

- получили название межгрупповой и внутригрупповой дисперсиями.
Доказано, что, если влияние всех уровней фактора

на показатели качества (для нашего примера) одинаково, то

. Иными словами, межгрупповая и внутригрупповая дисперсии являются несмещенными оценками общей дисперсии генеральной совокупности и проверка нулевой гипотезы

сводится к проверки

. Для этого вычисляется критерий (статистика):

.
При правильности нулевой гипотезы

критерий

должен подчиняться закону распределения Фишера со степенями свободы

и

. Поэтому при заданном уровне значимости

критическое значение

критерия находим по таблицам

закона распределения Фишера.
Если

, то нулевая гипотеза отвергается и делается заключение о существенности влияния фактора

на случайную величину.
При

нет оснований отвергать гипотезу

и считают, что влияние фактора несущественно.
Кроме того, по величине отношения

судят, насколько сильно проявляется влияние фактора.
Для упрощения расчетов сумм квадратов

удобно пользоваться следующими формулами, которые позволяют предварительно не находить средние значения

и

:

,

.
Понятие о двухфакторном дисперсионном анализе
Двухфакторная дисперсионная модель имеет вид:

,
где

-значение наблюдений в ячейке

с номером

;

общая средняя;

- эффект, обусловленный влиянием

-го уровня фактора

;

- эффект, обусловленный влияние

-го уровня фактора

;

- эффект, обусловленный взаимодействием двух факторов

и

;

- случайная компонента, или возмущение, вызванное влиянием неконтролируемых факторов, т.е. вариация переменной внутри отдельных уровней факторов.
Например, в условиях предыдущей задачи о качестве различных

партий изделия изготавливались на различных

станках и требуется выяснить, имеются ли существенные различия в качестве изделий по каждому фактору:
·

- партия изделия;
·

- станок.
Все имеющиеся данные представим в виде таблицы, в которой по строкам – уровни

фактора

, по столбцам – уровни

фактора

, а в соответствующих клетках, или ячейках, таблицы находятся значения показателей качества изделий

:
Групповые средние находятся по формулам: