Смекни!
smekni.com

Теория случайных чисел (стр. 4 из 11)

НСВ

1. Равномерно распределенные D(X)=(b-a)2/12

2. Нормально распределенные D(X)= s2

3. Экспоненциально распределенные D(X)=1/l2

Математическое ожидание и дисперсия суммы случайных величин

X1,X2,…,Xn – независимые СВ с одинаковым законом распределения.

M(Xk)=aD(Xk)=s2

– среднее арифметическое

Другие числовые характеристики СВ

Моменты распределения делятся на начальные моменты, центральные и смешанные.

1. Начальные моменты qго порядка (q=1,2,…): M(X1)=МО

2. Центральные моменты qго порядка: M((X-m)2)=D

M(x-m)q=M(x)q-Cq1mM(x)q-1+ Cq2mM(x)q-2+…+(-1)qmq

M(x-m)3= M(x)3-3mM(x)2+2m3

M(x-m)2= M(x)2-m2=D(x)

Центральные моменты 3го и 4го порядков используются для получения коэффициентов асимметрии и эксцесса (As, Ex), характеризующих особенности конкретного распределения.

Для нормального закона распределения As=0.

Если As>0, то распределение имеет правостороннюю скошенность. При As<0 – левосторонняя скошенность.

Эксцесс характеризует остро- или плосковершинность исследуемого распределения по сравнению с нормальным распределением.

НСВ:

1. Нормальное распределение: Ex=As=0

2. Равномерное распределение: As=0, Ex=-1,2

3. Экспоненциальное распределение: As=2, Ex=9.

Биноминальное:

3. Смешанные моменты:

Начальный смешанный момент порядка (k+s) системы 2х СВ (X+Y):

Центральный моменты порядка (k+s):

Центральный смешанный момент второго порядка:

Kxy=M((X-mx)(Y-my)) – корреляционный момент

– коэффициент корреляции

Мода ДСВ – значение СВ, имеющее максимальную вероятность.

Мода НСВ – значение СВ, соответствующее максимуму функции плотности вероятности f(x).

Обозначение моды: m0, M0(x), mod(x).

Медиана СВ Х (me, Me(x), med(x)) – значение СВ, для которого выполняется равенство:

P(X<me)=P(X>me)

F(me)=0,5.

Медиана – это площадь, получаемая делением фигуры пополам.

В симметричном распределении m=m0=me. В несимметричном они не равны.

Так как мода и медиана зависят от структуры распределения, их называют структурными средними.

Медиана – это значение признака, который делит ранжированный ряд значений СВ на две равных по объему группы. В свою очередь, внутри каждой группы могут быть найдены те значения признака, которые делят группы на 4 равные части – квартиль.

Ранжированный ряд значений СВ может быть поделен на 10 равных частей – децилей, на 100 – центилей.

Такие величины, делящие ранжированный ряд значений СВ на несколько равных частей, называются квантилями.

Под p% квантилями понимаются такие значения признака в ранжированном ряду, которые не больше p% наблюдений.

Предельные теоремы теории вероятностей

Делятся на две группы: Закон Больших Чисел (ЗБЧ) и Центральная Предельная Теорема (ЦПТ).

Закон Больших Чисел устанавливает связь между абстрактными моделями теории вероятностей и основными ее понятиями и средними значениями, полученными при статистической обработке выборки ограниченного объема из генеральной совокупности. P, F(x), M(x), D(x).

ЗБЧ доказывает, что средние выборочные значения при n®¥ стремятся к соответствующим значениям генеральной совокупности: hn(A)®P, Xср®M(X), sср2®D(X), F*(X)®F(X).

Лемма Маркова. Если Y – СВ, принимающая не отрицательные значения, то для любого положительного e:

P(Y³e)£M(x)/e, P(Y<e)³1-M(x)/e.

Доказательство. Рассмотрим Y и

: Ye£Y, M(Ye)£M(Y)

M(Ye)=0×P(Y<e)+e×P(Y³e)=e×P(Y³e)

M(Y)³M(Ye)=e×P(Y³e).

Лемма позволяет сделать оценку вероятности наступления события по математическому ожиданию этой СВ.

Неравенство Чебышева. Для любой СВ с ограниченными первыми двумя моментами (есть МО и D) и для любого e>0:

Доказательство. По лемме Маркова: рассмотрим не отрицательную СВ Y

Y=(X-m)2 M(Y)=M(X-m)2=D(x)

P(|X-m|³e)=P((X-m)2³e2)=P(Y³e2)£M(Y)/e2=D(x)/e2.

Требуется только знание дисперсии СВ при любом законе распределения.

ЗБЧ в форме Чебышева. X1, X2, …, Xn – последовательность независимых СВ. Для любого e>0 и n®¥:

ЗБЧ в форме Бернулли. m – число успехов в серии из n последовательных испытаний Бернулли. P – вероятность успеха в каждом отдельном испытании. e>0:

ЗБЧ носит чисто качественный характер. В тех же условиях неравенство Чебышева позволяет получить количественную характеристику оценки вероятности.

Пример. Для определения вероятности события проведено 40000 опытов. События наблюдалось в m=16042 случаях. За вероятность события принимается относительная частота наступления события: m/n»0,4. Применяя неравенство Чебышева, оценить, с какой вероятностью можно гарантировать, что число 0,4, принятое за вероятность, отличается от истинной вероятности не больше, чем на 0,05.

Неизвестные p и q находим из системы уравнений:

=>

Центральная предельная теорема Ляпунова.

Предмет внимания этой теоремы – распределение суммы большого числа СВ.

X=(x1+x2+…+xn)/n

Распределение суммы n независимых СВ в независимости от их законов распределения асимптотически сходятся к нормальному закону при неограниченном числе слагаемых и ограниченных двух первых моментах (МО и D).

Если si2=s2, то sх2=s2/n,

.

D(x)=sх2=(s12+s22+…sn2)/n2

ЦПТ универсальны и справедливы как для НСВ, так и для ДСВ.

P(a<X<b)=Ф(t2)-Ф(t1).

t2=(b-mx)/sx t2=(a-mx)/sx

Sn=(X1+X2+…+Xn)/n

P(|Sn-m|<zs)=2Ф(z)

M(xk)=m D(xk)=s2

ЦПТ в интегральной форме Муавра-Лапласа.

Статистическое оценивание параметров распределения

Мы анализируем только выборки из генеральной совокупности. По средне выборочным параметрам находим параметры самой генеральной совокупности.

Задачи такого рода решаются методами проверки статистических гипотез и статистической оценки параметров распределения.

Прежде нужно получить и провести первичную обработку исходных экспериментальных данных.

Статистические ряды часто изображают графически в виде полигона, гистограммы, кумулятивной кривой F*(x).

Полигон – ломаная линия, соединяющая в декартовой системе координат точки (xi,ni), (xi,mxi).

Кумулятивная кривая строится по точкам (xi,F*(xi)).

Гистограмма – на оси абсцисс – отрезки интервалов t, на этих интервалах строятся прямоугольники с высотой, равной относительной частоте признака. По гистограмме легко строится полигон.

И полигон, и гистограмма характеризуют функцию f*(x) – плотность вероятности.

НСВ – проблема выбора интервала варьирования h.

h выбирается, исходя из необходимости выявления характерных черт рассматриваемого распределения.

Правило Старджесса:

Как только характерные особенности распределения проявились, ставится вопрос об условиях, при которых сформировалось данное распределение – вопрос об однородности статистических данных.