Согласно [1] нормальное распределение симметрично относительно точки х = μ и имеет два параметра μ=0 и σ=1, совпадающих со средним значением и стандартным отклонением. Параметр μхарактеризует положение μна оси х, а параметр σ определяет степень рассеяния случайной величины относительно μ.
1.2.3 Проверка гипотезы о нормальности распределения с помощью графического метода
Данный метод основан на построении кумулятивной функции распределения наблюденных значений на бумаге для нормальных вероятностных графиков. Вертикальная ось имеет нелинейную шкалу, соответствующую площади под стандартной функцией нормального распределения и размечена значениями кумулятивной относительной частоты (в %). Другая ось имеет линейную шкалу для упорядоченных значений х. Если кумулятивная функция распределения переменной Х приближается к прямой линии, то распределение переменной Х будет нормальным [2].
Этот подход важен тем, что дает наглядную информацию по типу отклонения от нормального распределения. Чем больше объем выборки, тем более надежны заключения, которые можно вывести из вида графика функции распределения. Именно поэтому мною был выбран этот метод.
Графическая процедура состоит в расположении наблюденных значений (х1, х2, …хn) в неубывающем порядке и затем в нанесении значений вероятности Pk, рассчитанных по формуле (2):
(2)на бумагу для нормальных вероятностных графиков (где k- порядковый номер х; k=1,…, n).
По данным выборки построим вариационный ряд, рассчитаем значения кумулятивной относительной частоты (в %) и заполним таблицу 1.
Таблица 1 – Данные для построениякумулятивной функции распределения
k | xk | P, % |
1 | -12,141 | 0,124938 |
2 | -11,405 | 0,324838 |
3 | -10,759 | 0,524738 |
4 | -10,361 | 0,724638 |
5 | -9,91 | 0,924538 |
… | … | … |
496 | 12,774 | 99,07546 |
497 | 13,832 | 99,27536 |
498 | 13,981 | 99,47526 |
499 | 14,237 | 99,67516 |
500 | 14,732 | 99,87506 |
По рассчитанным значениям построим график кумулятивной функции распределения заданной выборки:
Рисунок 3 – Кумулятивная функция распределения
Построенный график представлен набором точек, которые рассеяны около прямой линии - это дает первое подтверждение гипотезе о нормальном распределении генеральной совокупности, из которой взята выборка. Следует также отметить, что в данном случае частотное распределение имеет большую кривизну (график более выпуклый), но это не опровергает гипотезу Н0. Можно сделать вывод, что гипотеза о нормальном распределении для выборки наблюдений адекватна.
К сожалению, использование только одного критерия для проверки гипотезы о виде распределения не может быть до конца объективным. Поэтому рассмотрим еще один критерий – Колмогорова-Смирнова, модифицированный для проверки нормальности распределения.
1.2.4 Критерий Колмогорова-Смирнова, модифицирован-ный для проверки нормальности распределения
Данный критерий основан на общем критерии Колмогорова-Смирнова и его применение в нашем эксперименте возможно, так как теоретическая функция распределения неизвестна нам с точностью до параметров μ и σ (они будут оцениваться по выборке). Алгоритм проверки гипотезы Н0 аналогичен алгоритму общего критерия, в данном случае меняются только критические значения - используется модифицированная статистика, рассчитываемая по формуле (3):
(3)критические значения которой
(α - уровень значимости) приведены в таблице 2.Таблица 2 – Критические значения статистики Колмогорова-Смирнова, модифицированной для проверки нормальности распределения
По формулам (4), (5) находим среднее значение и стандартное отклонение для заданной выборки:
(4), (5) =2,006742, S = 4,8843.Тогдаzi =
. Результаты расчетов сведем в таблицу 3.Таблица 3 - Результаты расчетов модифицированного критерия Колмогорова - Смирнова
i | xi | zi | Ф(zi) | - Ф(zi) | Ф(zi) – | ||
1 | -12,141 | -2,89656 | 0,001886 | 0,002 | 0 | 0,000114 | 0,001886 |
2 | -11,405 | -2,74588 | 0,003017 | 0,004 | 0,002 | 0,000983 | 0,001017 |
3 | -10,759 | -2,61362 | 0,004479 | 0,006 | 0,004 | 0,001521 | 0,000479 |
4 | -10,361 | -2,53213 | 0,005669 | 0,008 | 0,006 | 0,002331 | -0,00033 |
5 | -9,91 | -2,4398 | 0,007348 | 0,01 | 0,008 | 0,002652 | -0,00065 |
6 | -9,642 | -2,38493 | 0,008541 | 0,012 | 0,01 | 0,003459 | -0,00146 |
7 | -9,396 | -2,33456 | 0,009783 | 0,014 | 0,012 | 0,004217 | -0,00222 |
… | … | … | … | … | … | … | … |
495 | 12,29 | 2,105361 | 0,98237 | 0,99 | 0,988 | 0,00763 | -0,00563 |
496 | 12,774 | 2,204454 | 0,986254 | 0,992 | 0,99 | 0,005746 | -0,00375 |
497 | 13,832 | 2,421065 | 0,992262 | 0,994 | 0,992 | 0,001738 | 0,000262 |
498 | 13,981 | 2,451571 | 0,992888 | 0,996 | 0,994 | 0,003112 | -0,00111 |
499 | 14,237 | 2,503984 | 0,99386 | 0,998 | 0,996 | 0,00414 | -0,00214 |
500 | 14,732 | 2,605328 | 0,995411 | 1 | 0,998 | 0,004589 | -0,00259 |
Из таблицы 3 следует, что:
,
.
=Далее
= 0,59782. Из таблицы 2 имеем = 0,895.Так как
=0,59782 < =0,895, гипотеза нормальности распределения не отклоняется.1.3 Получение точечных и интервальных оценок параметров распределения
1.3.1 Сущность задачи точечного и интервального оценивания параметров
Точечная оценка предполагает нахождение единственной числовой величины, которая и принимается за значение параметра. Такую оценку целесообразно определять в тех случаях, когда объем экспериментальных данных достаточно велик. Причем не существует единого понятия о достаточном объеме экспериментальных данных, его значение зависит от вида оцениваемого параметра. При малом объеме экспериментальных данных точечные оценки могут значительно отличаться от истинных значений параметров, что делает их непригодными для использования.
Интервальный метод оценивания параметров распределения случайных величин заключается в определении интервала (а не единичного значения), в котором с заданной степенью достоверности будет заключено значение оцениваемого параметра. Интервальная оценка характеризуется двумя числами – концами интервала, внутри которого предположительно находится истинное значение параметра. Иначе говоря, вместо отдельной точки для оцениваемого параметра можно установить интервал значений, одна из точек которого является своего рода "лучшей" оценкой. Интервальные оценки являются более полными и надежными по сравнению с точечными, они применяются как для больших, так и для малых выборок. Совокупность методов определения промежутка, в котором лежит значение параметра Т, получила название методов интервального оценивания.
Для нормального распределения параметрами являются μ и σ2. Параметр μ — среднее значение (математическое ожидание) случайной величины и указывает координату максимума кривой плотности распределения, а σ² — дисперсия, которая определяет меру разброса данной случайной величины.
1.3.2 Точечные оценки параметров распределения
Согласно [3] оценка среднего значения выборки из генеральной совокупности производится по формуле (6):
(6)Точечная оценка дисперсии D и стандартного отклонения σ генеральной совокупности осуществляется по формулам (7), (8):
(7) (8)