Введение........................................................................................................... 2
1 Постановка задачи....................................................................................... 3
2 Математические и алгоритмические основы решения задачи................... 8
2.1 Общие понятия статистической проверки гипотез.................................. 8
2.2 t-критерий Стьюдента............................................................................. 13
3 Функциональные модели решения задачи................................................ 16
4 Программная реализация решения задачи............................................... 19
5 Пример выполнения программы............................................................... 23
Заключение.................................................................................................... 26
Список использованных источников и литературы.................................... 27
Введение
Статистическая проверка гипотез – система приёмов в математической статистике, предназначенных для проверки соответствия опытных данных некоторой статистической гипотезе. Процедуры статистической проверки гипотез позволяют принимать или отвергать статистические гипотезы, возникающие при обработке или интерпретации результатов измерений во многих практически важных разделах науки и производства, связанных с экспериментом. Правило, по которому принимается или отклоняется данная гипотеза, называется статистическим критерием. Построение критерия определяется выбором подходящей функции Т от результатов наблюдений, которая служит мерой расхождения между опытными и гипотетическими значениями. Эта функция, являющаяся случайной величиной, называется статистикой критерия, при этом предполагается, что распределение вероятностей Т может быть вычислено при допущении, что проверяемая гипотеза верна. По распределению статистики Т находится значение Т0, такое, что если гипотеза верна, то вероятность неравенства T >T0 равна α, где α — заранее заданный Значимости уровень. Если в конкретном случае обнаружится, что Т > T0, то гипотеза отвергается, тогда как появление значения Т ≤ T0 не противоречит гипотезе.
Целью данной курсовой работы является ЛИСП-реализация методов проверки статистических гипотез.
1 Постановка задачи
Требуется реализовать программу проверки статистических гипотез. Для реализации воспользуемся t-критерием Стьюдента.
Пример 1. Проверка гипотезы при наличии одной выборки
Имеются данные о заработной плате, полученные в ходе опроса: 450,680,850,1500,3500,1200,1000,700. Необходимо определить, является средняя заработная плата в регионе равной 1500 рублей.
Сформулируем нулевую и альтернативную гипотезу.
H0:
- средняя заработная плата равна 1500 рублей.H1:
- средняя заработная плата не равна 1500 рублейВыбор уровня значимости (вероятности ошибки).
.Выбор теста.
t критерий Стьюдента:
,где
,где
- среднее значение выборки, - среднее значение нулевой гипотезы, - среднеквадратическое отклонение, n – количество данных в выборке.Определение критической области.
Так как альтернативная гипотеза имеет следующий вид: H1:
, то необходимо применять двусторонний тест. Для определения критической области рассчитаем t (7, 0.005)=4.029 [t(n-1, /2)].Правило принятия (отвержения) гипотезы: если TR<-4.029 и TR>4.029, то отвергается H0 и принимается H1.
Выполнение необходимых вычислений.
Вычислим t расчетное (TR) :
Таблица 1 – Вспомогательные расчеты
450 | -785 | 616225 |
680 | -555 | 308025 |
850 | -385 | 148225 |
1500 | 265 | 70225 |
3500 | 2265 | 5130225 |
1200 | -35 | 1225 |
1000 | -235 | 55225 |
700 | -535 | 286225 |
6615600 |
Таким образом имеем:
= =972,15 = =-0,77Принятие статистического решения.
Так как -4.029<TR<4.029, тогда с
=0.01 гипотеза Н0 о равенстве среднего значения заработной платы в размере 1500 р. принимается при =0.01. Следовательно, средняя заработная плата составляет 1500 рублей.Если мы хотим узнать, является ли заработная плата выше чем 1500 рублей, то необходимо сформулировать новые гипотезы:
H0:
- средняя заработная плата равна 1500 рублей.H1:
- средняя заработная плата не равна 1500 рублейТак как альтернативная гипотеза имеет следующий вид: H1:
, то необходимо применять односторонний тест. Для определения критической области рассчитаем t (7, 0.01)=3.499 [t(n-1, )]. , то гипотеза H0 о равенстве среднего значения заработной платы 1500 рублей принимается при =0.01. Следовательно, нельзя говорить о том, что средняя заработная плата выше 1500 рублей.Пример 2. Проверка гипотез по двум выборкам
Пусть, после проведения экономических реформ снова был произведен опрос о заработной плате. Получены новые данные: 600,600,1300,1100,3700,1600,1100,800.
Необходимо выяснить, привели ли реформы к росту благосостояния населения.
Сформулируем гипотезы:
H0:
- средняя заработная плата до реформ равна средней зарплате после реформ.H1:
- средняя заработная после реформ больше, чем средняя зарплата до реформВыбор уровня значимости (вероятности ошибки).
.Выбор теста.
t критерий Стьюдента для двух выборок:
.Число степеней свободы:
,где
- среднее значение выборки, - среднеквадратическое отклонение, n – количество данных в выборке.Выполнение необходимых вычислений.
Вычислим t расчетное (TR) :
Число степеней свободы:
Определение критической области.
Для определения критической области рассчитаем число степеней свободы t (14, 0.01)=2.977 [t(n-1,
/2)].Правило принятия (отвержения) гипотезы: если TR<-2.977, то отвергается H0 и принимается H1.
Поскольку -0.23>-2.977, то нулевая гипотеза не отвергается, по вероятности ошибки 0.01. Следовательно, средняя заработная плата до проведения реформ равна средней заработной плате после проведения реформ. Таким образом, проведенные реформы не привели к существенному росту благосостояния населения.
2 Математические и алгоритмические основы решения задачи
2.1 Общие понятия статистической проверки гипотез
Статистическая гипотеза обычно представляет собой некоторое предположение об одном или нескольких параметрах функции распределения случайной величины.
Пример статистической гипотезы: «генеральная совокупность распределена по нормальному закону», «различие между дисперсиями двух выборок незначимо» и т.д.
В теории статистического вывода обычно проверяются гипотезы на основе выборочной информации. В практике статистической работы чаще всего имеют дело с двумя конкурирующими гипотезами: нулевой гипотезой, обозначаемой H0; и альтернативной гипотезой, обозначаемой H1. Нулевая гипотеза используется при статистической проверке гипотез об отсутствии существующих различий между несколькими выборочными совокупностями, для суждения о близости фактического распределения к теоретическому (нормальному), об отсутствии зависимости между признаками. Суть нулевой гипотезы состоит в признании того, что выборки взяты из одной совокупности, фактическое распределение укладывается в теоретическое, зависимость между признаками отсутствует и т. д. Следовательно, нулевая гипотеза - это гипотеза, подлежащая проверке. И если отвергается нулевая гипотеза как неподходящая в каком-то статистическом смысле, то принимается альтернативная гипотеза.