1) случайная величина
, вычисляемая по формуле (1.1), сходится по вероятности к (1.1)2) случайная величина
имеет асимптотически нормальное распределение вероятностей с центром и дисперсией, вычисляемой по формуле (1.2), при условии, что существует общая дисперсия величин . (1.2)На основании центральной предельной теоремы рассмотрим сумму
,где
- совокупность взаимно независимых равномерно распределенных случайных величин на отрезке R[0,1].Известно, что каждая из случайных величин
с распределением R[0,1] имеет математическое ожидание (1.3) и дисперсию (1.4). (1.3) (1.4)Тогда согласно теоремам сложения математических ожиданий и дисперсий
, .Следовательно, случайная величина (1.5) имеет математическое ожидание
и дисперсию и при ее распределение стремится к нормальному. (1.5)В данной работе дано количество слагаемых в сумме N, задано математическое ожидание
и стандартное отклонение выходной случайной величины y. Если известна случайная величина с распределением N[0,1], то случайная величина с распределением N[ ] получается в результате линейного преобразования (1.6)Гистограмма распределения представляет собой удобный способ представления статистических данных. Гистограмма строится следующим образом:
Пусть имеется выборка случайной величины объемом n:
. Из этой выборки определяются минимальные (1.7) и максимальные (1.8) значения: (1.7)При данных условиях
(1.8)При данных условиях
Весь отрезок [A,B] разбивается на K интервалов, как правило, одинаковой длины.
Число интервалов при построении гистограммы не должно быть слишком большим и слишком малым. При большом количестве интервалов в гистограмме обнаруживаются незакономерные колебания. На практике рекомендуется в каждом интервале иметь не менее 5-10 точек. Предварительный выбор количества интервалов можно сделать по правилу Стургенса:
(1.9)где n – объём выборки,
() – операция взятия целой части от действительного числа Если число точек в интервале слишком мало (порядка 1-2), то имеет смысл объединить некоторые интервалы и пересчитать гистограмму.Найдя количество интервалов разбиения, можно вычислить длину каждого интервала по формуле:
или (1.10)Для построения гистограммы нужно частоту попадания случайных величин xk в каждый интервал [
) разделить на его длину и полученную величину взять в качестве высоты прямоугольника на графике. Причем последний интервал необходимо рассмотреть как отрезок. Таким образом, описанное правило можно изобразить математически: (1.11) (1.12)где
и - границы интервала, - частота попадания выборочных величин в интервал ( )n – объём выборки
- высота прямоугольника на графикеИз способа построения гистограммы следует, что полная площадь всех прямоугольников равна единице:
(1.13)где fs(x) - эмпирическая плотность распределения (полученная экспериментально), которую можно вычислить по формуле:
(1.14)На полученную гистограмму для качественного анализа необходимо наложить теоретическую плотность распределения случайной величины, распределенной по закону
(1.15)В итоге получится гистограмма распределения (см. график 1) с отображением эмпирической и теоретической плотностей распределения, которая даёт возможность наглядно сравнить эти плотности.
График 1 – Сравнение эмпирической и теоретической плотностей распределения
1.2 Вычисление выборочного среднего и выборочной дисперсии
В качестве оценки для математического ожидания (выборочного среднего) используется среднее арифметическое от наблюдаемых значений случайной величины:
(1.16)Тогда выборочную дисперсию можно рассчитать по следующей формуле:
(1.17)Для дисперсии в качестве несмещенной и состоятельной оценки используется величина:
(1.18)Полученная оценка для дисперсии применяется для дальнейших вычислений доверительных интервалов.
1.3 Построение доверительных интервалов для математического ожидания и дисперсии, соответствующих доверительной вероятности
Чтобы иметь представление о точности и надежности оценок (1.16 – 1. 18) в математической статистике используется понятие доверительного интервала. Пусть для некоторого параметра a (математического ожидания или дисперсии) получена несмещенная оценка μ. Назначим некоторую достаточно большую вероятность γ (доверительную вероятность) и найдем такое значение ε, при котором вероятность равна (1.19):
(1.19)Равенство (1.19) означает, что с вероятностью γ интервал Iγ, который называется доверительным интервалом, накрывает неизвестное значение параметра a.
(1.20)При построении доверительного интервала для математического ожидания используют то обстоятельство, что оценка (1.16) представляет собой сумму n независимых одинаково распределенных случайных величин Xi и, согласно центральной предельной теореме, при достаточно больших n ее закон распределения близок к нормальному закону. В этом случае доверительный интервал для оценки математического ожидания можно представить в виде
(1.21)где tγ – квантиль нормального распределения, который определяется по статистическим таблицам.