По таблице распределения χ2 мы должны выбрать такие два числа
, чтобы площадь заштрихованная была равна 1-α.Обычно величины
выбирают таким образом, чтобы выполнялось неравенство:В таблице распределения χ2 имеется только вероятность вида:
Тогда:
Преобразуя это неравенство получим:
- доверительный интервал с уровнем значимости α.Проверка статистических гипотез.
Наряду с оценкой параметров распределения по выборочным данным большой интерес представляет вид (закон) распределения неизвестный на практике. Такие задачи решаются методами статических гипотез.
Относительно неизвестного теоретического распределения формируется некоторое предположение, которое формируется в виде гипотез.
Например, теоретическое распределение подчиняется нормальному, экспоненциальному закону.
При проверки гипотез используется принцип значимости основывающийся на принципе практической невозможности.
Согласно принципу практической невозможности события с очень малыми вероятностями в практических приложениях считаются невозможными.
Максимум таких вероятностей определяет уровень значимости α, который задаётся.
В свою очередь согласно принципу значимости отвергается случайность появления практически невозможного события.
Поскольку теоретическое распределение задано гипотезой, то легко рассчитать вероятность появления некоторого события при проведении испытаний или взятии выборки и пусть такая расчётная вероятность не превышает ε, т.е. событие является практически невозможным.
Если же такое событие происходит, то возникает противоречие между выдвинутой гипотезой и выборкой. Гипотезу следует отвергнуть в этом и заключается содержание принципа значимости.
Проверяемая гипотеза называется нулевой или основной Н0.
Если гипотеза отвергается, то принимается противопоставляемая ей гипотеза Н1, которая называется конкурирующей ил альтернативной.
Про проверки гипотезы Н0 возможны ошибки.
Можно отвергнуть гипотезу Н0 в условиях когда она верна и совершить ошибку I-го рода и можно принять гипотезу, когда она не верна и совершить ошибку II-го рода.
Решение поставленной задачи по сути дела состоит в разделении всего множества выборочных данных на 2-а не пересекающихся подмножества О и W. Таких, что решение принимается в пользу гипотезы Н0, если выборка принадлежит области О и в пользу гипотезы Н1, если выборка принадлежит подмножеству W. Область W называется критической областью выборочного пространства. Здесь гипотеза Н0 отвергается, а область О является областью допустимых значений. Здесь гипотеза Н0 принимается.
Проверка гипотезы о равенстве центров распределения математического ожидания 2-х нормальных генеральных совокупностей.
Задача имеет большой практический интерес. Достаточно часто наблюдается такая ситуация, что средний результат в одной серии эксперимента отличается от среднего результата в другой серии эксперимента.
Возникает вопрос: можно ли объяснить отличительное расхождение случайными ошибками эксперимента и относительно малыми объёмами выборки или это отклонение вызвано какими-либо неизвестными, незамеченными закономерностями.
Имеется две случайных величин Х и Y с нормальным законом распределения.
Получим 2-е независимых выборки объёмом n1 и n2 из указанных генеральных совокупностей.
Необходимо проверить: Н0: М(X) = М(Y)
H1: |M(X) – M(Y)| > 0
Рассмотрим два случая:
1. – известны дисперсия генеральной совокупности
;2. – дисперсия неизвестна
.1 -
, M(X) и M(Y) - неизвестны, для их оценки мы используем средние выборочныеОтносительно известно, что они подчиняются нормальному закону распределения с параметрами:
Рассмотрим случайную величину . В силунезависимости выборок эта случайная величина подчиняется нормальному закону распределения.
Её дисперсия:
Если гипотез Н0 верна(справедлива), то тогда:
.Величина:
с параметрами (0, 1)Выбирая уровень значимости α или доверительную вероятность Р = 1- α можем записать:
; ;Выбирая по величине интеграла вероятности значения ZP мы тем самым делим выборочных данных на область допустимых значений и критическую область.
Для области, где выполняется неравенство |Z| ≤ ZP – область допустимых значений(ОДЗ) Н0 – принимается.
А, если |Z| > ZP – критическая область(КО) Н0 – отвергается, Н1 – принимается.
Чем меньше α, тем меньше вероятность отклонить проверяемую гипотезе, если она верна. Но в этом случае увеличивается вероятность совершения ошибки II-го рода.
Чем меньше α, тем больше ОДЗ и тем больше вероятность принять проверяемую гипотезу, если она не верна, т.е. совершить ошибку II-го рода.
Методы проверки гипотез позволяют только отвергнуть проверяемую гипотезу, но они не могут доказать её справедливость.
2 -Дисперсия неизвестна.
Есть 2-е случайных величины X и Y,
. mx и my неизвестны берутся независимые выборки (n1;n2) и рассматривается гипотеза: Н0: M(X) = M(Y)H1: |M(X) – M(Y)| > 0.
Для оценки математического ожидания M(X) и M(Y) используем среднее выборочное
. Для оценки дисперсий используем: - несмещённые, состоятельные оценки дисперсии.Поскольку генеральные совокупности X и Y имеют одинаковые дисперсии, то для оценки дисперсии
целесообразно использовать результаты обеих выборок.Наиболее целесообразной оценкой дисперсии является средняя взвешенная этих двух оценок.
Если гипотеза Н0 справедлива, то тогда случайная величина
подчиняется нормальному закону распределения с и с дисперсиейЕсли построить случайную величину:
, то она будет подчиняться нормальному закону с параметрами (0; 1).
Т.к.
неизвестна, то такая величина подчиняется t-распределению Стьюдента(со степенями свободы n1 + n2 – 2).Для α(Р = 1– α) подсчитывается критическое значение
Если вычисленные значения
, то гипотеза Н0 отвергается и наоборот: Н0 принимается.