2. непараметрические - это гипотезы, сформулированные относительно вида распределения (например, определение по выборке степени нормальности генеральной совокупности). Процесс использования выборки для проверки гипотезы называется статистическим доказательством. Основную выдвигаемую гипотезу называют нулевой Но. Наряду с нулевой гипотезой рассматривают альтернативную ей H1. Например, Н0: М(х)=1, математическое ожидание генеральной совокупности равно 1; H1: M(x)>1, или М(х)<1, или М(х)
1 (математическое ожидание больше 1, или меньше 1, или не равно 1).Выбор между гипотезами Но и H1 может сопровождаться ошибками двух родов. Ошибка первого рода
. означает вероятность принятия H1, если верна гипотеза Н0: . Ошибка второго рода означает вероятность принятия Но, если верна гипотеза H1: .Существует правильное решение двух видов:
и (табл.7).Таблица 1 Ошибки первого и второго родов
Принятая гипотеза | Но | Н1 |
Но - верна | ||
Но – не верна |
Правило, по которому принимается решение о том, верна или не верна гипотеза Но, называется критерием, где:
-уровень значимости критерия;М=
-мощность критерия.Статистическим критерием «К» называют случайную величину, с помощью которой принимают решение о принятии или отклонении Но.
Замечание. Для проверки параметрических гипотез используют критерии значимости, основанные на статистиках u,
t, F. Непараметрические гипотезы проверяют с помощью критериев согласия, использующих статистики распределений: Колмогорова-Смирнова и т.д.Например, Но: M(x)=10. В зависимости от альтернативной гипотезы рассматривают три случая:
1.Если Н1: M(x)
10.В этом случае рассматривают двустороннюю критическую область и используют дифференциальную функцию f(K/H0), для определения соответствующих квантилей (границ области принятия гипотезы - левой (К
) и правой (К ))- Площадь под криволинейной трапецией дифференциальной функции слева от K и справа от К равна . Общая площадь ограниченная криволинейной трапецией дифференциальной функции, квантилями и осью абсцисс, равна(1 -α):2. Если Н1: M(x)> 10, то рассматривается правосторонняя критическая область (площадь под криволинейной трапецией справа от К
равна ); (1.4)Рис.2. Правосторонняя критическая область
3. Если Н1: M(x)< 10, то рассматривается левосторонняя критическая область (площадь под криволинейной трапецией слева от К
равна ): (1.5)Рис. 3. Левосторонняя критическая область
Алгоритм проверки статистических гипотез
Располагая выборочными данными (х1,х2,...,хn), формируют нулевую гипотезу h0и конкурирующую гипотезу H1 .
1. Задают уровень значимости
(обычно принимают =0,1; 0,01; 0,05; 0,001).2. Рассматривается выборочная статистика наблюдений (критерий) К, обычно одна из перечисленных ниже:
u - нормальное распределение;
- распределение Пирсона (хи - квадрат);t - распределение Стьюдента;
F - распределение Фишера - Снедекора.
4. На основании выборки (х1,х2,...,хn) - определяют значение критерия (статистики) К (приложения 5-7) В зависимости от вида альтернативной гипотезы выбирают по соответствующей таблице квантили критерия для двусторонней (K и К ) или односторонней области (K или К ). Если значения критерия попадают в критическую область, то Ноотвергается; в противном случае принимается гипотеза Но и считается, что Но не противоречит выборочным данным (при этом существует возможность ошибки с вероятностью, равной
).Замечание. Следует отметить, что возможность принятия гипотезы происходит из принципа невозможности наступления маловероятных событий. Те же события, вероятность которых близка к 1, принимаются за достоверные. Возникает проблема выбора уровня риска (уровня значимости
).В одних случаях возможно пренебрегать событиями р<0,05, в других -нельзя пренебрегать событиями, которые могут появиться с р=0,001 (разрушение сооружений, транспортных средств и т. д.).
Сформулировать и проверить статистические гипотезы,на основании которых можно выяснить:
- можно или нет двум предприятиям разрешить сброс сточных вод?
- одинакова ли квалификация обоих лаборантов (то есть, отличаются ли у них значимо результаты анализов)?
- сколько образцов достаточно брать для испытаний на, первом и втором предприятиях?
Актуальность построения математической модели состоит в том, что изменение качества водного объекта ведёт к сильным изменениям среды. Оно может произойти из-за некоего антропогенного воздействия, как правило, негативного. Такими воздействиями могут являться сбросы сточных вод. При существующей безнаказанности и безответственности некоторых руководителей промышленных предприятий очень важно уметь правильно определить изменение состояния, а соответственно индексы показателей качества воды при залповом сбросе сточных вод для дальнейшего взыскания экологических штрафов за превышение допустимых показателей и несанкционированный сброс. При аварийных сбросах также важно оценить катастрофичность ситуации.
Лаборатория проводит анализ проб воды с целью определения наличия в них вредных веществ. С определенным видом проб работают два лаборанта, результаты анализов сравниваются. Пробы воды поступают из двух предприятий. Лаборатория должна дать заключение, о допустимости сброса сточных вод. Кроме того, руководителя лаборатории интересует вопрос: отличаются ли по точности результаты экспериментов у первого и второго лаборанта? Им было предложено независимо проанализировать одни и те же образцы. Для этих образцов необходимо было определить содержание вредного вещества X. В единице объема количество Х не должно превышать 0,015. Уровень значимости
. Данные измерений представлены таблицами 1-4.Данные измерений, проведенных лаборантами приведены в таблицах:
Таблица 1 Лаборант 1,пункт 1; n1= 120
Xj | 0,0110 | 0,0120 | 0,0127 | 0,0130 | 0,0138 | 0,0014 | 0,0150 | 0,0156 | 0,0170 | 0,0180 |
nj | 2 | 2 | 7 | 16 | 30 | 35 | 20 | 5 | 2 | 1 |
Таблица 2 Лаборант 1,пункт 2; N2 = 25
Xj | 0,0120 | 0,0128 | 0,0135 | 0,0140 | 0,0147 | 0,0156 | 0,0160 |
nj | 1 | 2 | 5 | 10 | 4 | 2 | 1 |
Таблица 3 Лаборант 2, пункт 1; N3 = 110