Дисперсийный анализ (стр. 2 из 4)

Пусть имеется m партий изделий. Из каждой партии отобрано соответственно n₁,n₂, …, n_m изделий (для простоты полагается, что n₁=n₂=...=n_m=n). Значения показателя качества этих изделий представлены в матрице наблюдений:

x₁₁ x₁₂… x_1n

x₂₁ x₂₂ … x_2n

………………… = (x_ij), (i = 1,2, …, m; j = 1,2, …, n).

x_m₁x_m₂… x_mn

Необходимо проверить существенность влияния партий изделий на их качество.

Если полагать, что элементы строк матрицы наблюдений – это численные значения случайных величин Х₁,Х₂,...,Х_m, выражающих качество изделий и имеющих нормальный закон распределения с математическими ожиданиями соответственно a₁,а₂,...,а_m и одинаковыми дисперсиями σ², то данная задача сводится к проверке нулевой гипотезы Н₀: a₁=a₂ =...= а_m, осуществляемой в дисперсионном анализе.

Усреднение по какому-либо индексу обозначено звездочкой (или точкой) вместо индекса, тогда средний показатель качества изделий i-й партии, или групповая средняя для i-го уровня фактора, примет вид:

, (4)

где

_i* – среднее значение по столбцам;

_ij – элемент матрицы наблюдений;

n – объем выборки.

А общая средняя:

. (5)

Сумма квадратов отклонений наблюдений х_ij от общей средней

выглядит так:

2. (6)

или

Q = Q₁ + Q₂ + Q₃.

Последнее слагаемое равно нулю

=0. (7)

так как сумма отклонений значений переменной от ее средней равна нулю, т.е.

2=0.

Первое слагаемое можно записать в виде:

В результате получается тождество:

Q = Q₁ +Q₂, (8)

где

- общая, или полная, сумма квадратов отклонений;

- сумма квадратов отклонений групповых средних от общей средней, или межгрупповая (факторная) сумма квадратов отклонений;

- сумма квадратов отклонений наблюдений от групповых средних, или внутригрупповая (остаточная) сумма квадратов отклонений.

В разложении (8) заключена основная идея дисперсионного анализа. Применительно к рассматриваемой задаче равенство (8) показывает, что общая вариация показателя качества, измеренная суммой Q, складывается из двух компонент – Q₁ и Q₂, характеризующих изменчивость этого показателя между партиями (Q₁) и изменчивость внутри партий (Q₂), характеризующих одинаковую для всех партий вариацию под воздействием неучтенных факторов.

В дисперсионном анализе анализируются не сами суммы квадратов отклонений, а так называемые средние квадраты, являющиеся несмещенными оценками соответствующих дисперсий, которые получаются делением сумм квадратов отклонений на соответствующее число степеней свободы.

Число степеней свободы определяется как общее число наблюдений минус число связывающих их уравнений. Поэтому для среднего квадрата s₁₂, являющегося несмещенной оценкой межгрупповой дисперсии, число степеней свободы k₁=m-1, так как при его расчете используются m групповых средних, связанных между собой одним уравнением (5). А для среднего квадрата s₂₂, являющегося несмещенной оценкой внутригрупповой дисперсии, число степеней свободы k₂=mn-m, т.к. при ее расчете используются все mn наблюдений, связанных между собой m уравнениями (4).

Таким образом:

= Q₁/(m-1),

= Q₂/(mn-m).

Если найти математические ожидания средних квадратов

, подставить в их формулы выражение x_ij (1) через параметры модели, то получится:

(9)

т.к. с учетом свойств математического ожидания

(10)

Для модели I с фиксированными уровнями фактора F_i(i=1,2,...,m) – величины неслучайные, поэтому

M(S

) =

2 /(m-1) +σ².

Гипотеза H0 примет вид F_i = F*(i = 1,2,...,m), т.е. влияние всех уровней фактора одно и то же. В случае справедливости этой гипотезы

M(S

)= M(S

)= σ².

Для случайной модели II слагаемое F_i в выражении (1) – величина случайная. Обозначая ее дисперсией

получим из (9)

(11)

и, как и в модели I

M(S

)= σ².

В таблице 1.1 представлен общий вид вычисления значений, с помощью дисперсионного анализа.

Таблица 1.1 – Базовая таблица дисперсионного анализа

Компоненты дисперсии	Сумма квадратов	Число степеней свободы	Средний квадрат	Математическое ожидание среднего квадрата
Межгрупповая		m-1	= Q₁/(m-1)
Внутригрупповая		mn-m	= Q₂/(mn-m)	M(S )= σ²
Общая		mn-1

Гипотеза H₀ примет вид σF² =0. В случае справедливости этой гипотезы

M(S

)= M(S

)= σ².

В случае однофакторного комплекса как для модели I, так и модели II средние квадраты S² и S², являются несмещенными и независимыми оценками одной и той же дисперсии σ².

Следовательно, проверка нулевой гипотезы H₀ свелась к проверке существенности различия несмещенных выборочных оценок S

и S

дисперсии σ².

Гипотеза H0 отвергается, если фактически вычисленное значение статистики F =S

больше критического F_α:K₁:K₂, определенного на уровне значимости α при числе степеней свободы k₁=m-1 и k₂=mn-m, и принимается, если F < Fα:K₁:K₂ .

F- распределение Фишера (для x > 0) имеет следующую функцию плотности (для

= 1, 2, ...;

= 1, 2, ...):