НСВ
1. Равномерно распределенные D(X)=(b-a)2/12
2. Нормально распределенные D(X)= s2
3. Экспоненциально распределенные D(X)=1/l2
Математическое ожидание и дисперсия суммы случайных величин
X1,X2,…,Xn – независимые СВ с одинаковым законом распределения.
M(Xk)=aD(Xk)=s2
– среднее арифметическоеДругие числовые характеристики СВ
Моменты распределения делятся на начальные моменты, центральные и смешанные.
1. Начальные моменты qго порядка (q=1,2,…): M(X1)=МО
2. Центральные моменты qго порядка: M((X-m)2)=D
M(x-m)q=M(x)q-Cq1mM(x)q-1+ Cq2mM(x)q-2+…+(-1)qmq
M(x-m)3= M(x)3-3mM(x)2+2m3
M(x-m)2= M(x)2-m2=D(x)
Центральные моменты 3го и 4го порядков используются для получения коэффициентов асимметрии и эксцесса (As, Ex), характеризующих особенности конкретного распределения.
Для нормального закона распределения As=0.
Если As>0, то распределение имеет правостороннюю скошенность. При As<0 – левосторонняя скошенность.
Эксцесс характеризует остро- или плосковершинность исследуемого распределения по сравнению с нормальным распределением.
НСВ:
1. Нормальное распределение: Ex=As=0
2. Равномерное распределение: As=0, Ex=-1,2
3. Экспоненциальное распределение: As=2, Ex=9.
Биноминальное:
3. Смешанные моменты:
Начальный смешанный момент порядка (k+s) системы 2х СВ (X+Y):
Центральный моменты порядка (k+s):
Центральный смешанный момент второго порядка:
Kxy=M((X-mx)(Y-my)) – корреляционный момент
– коэффициент корреляцииМода ДСВ – значение СВ, имеющее максимальную вероятность.
Мода НСВ – значение СВ, соответствующее максимуму функции плотности вероятности f(x).
Обозначение моды: m0, M0(x), mod(x).Медиана СВ Х (me, Me(x), med(x)) – значение СВ, для которого выполняется равенство:
P(X<me)=P(X>me)
F(me)=0,5.
Медиана – это площадь, получаемая делением фигуры пополам.
В симметричном распределении m=m0=me. В несимметричном они не равны.
Так как мода и медиана зависят от структуры распределения, их называют структурными средними.
Медиана – это значение признака, который делит ранжированный ряд значений СВ на две равных по объему группы. В свою очередь, внутри каждой группы могут быть найдены те значения признака, которые делят группы на 4 равные части – квартиль.
Ранжированный ряд значений СВ может быть поделен на 10 равных частей – децилей, на 100 – центилей.
Такие величины, делящие ранжированный ряд значений СВ на несколько равных частей, называются квантилями.
Под p% квантилями понимаются такие значения признака в ранжированном ряду, которые не больше p% наблюдений.
Предельные теоремы теории вероятностей
Делятся на две группы: Закон Больших Чисел (ЗБЧ) и Центральная Предельная Теорема (ЦПТ).
Закон Больших Чисел устанавливает связь между абстрактными моделями теории вероятностей и основными ее понятиями и средними значениями, полученными при статистической обработке выборки ограниченного объема из генеральной совокупности. P, F(x), M(x), D(x).
ЗБЧ доказывает, что средние выборочные значения при n®¥ стремятся к соответствующим значениям генеральной совокупности: hn(A)®P, Xср®M(X), sср2®D(X), F*(X)®F(X).
Лемма Маркова. Если Y – СВ, принимающая не отрицательные значения, то для любого положительного e:
P(Y³e)£M(x)/e, P(Y<e)³1-M(x)/e.
Доказательство. Рассмотрим Y и
: Ye£Y, M(Ye)£M(Y)M(Ye)=0×P(Y<e)+e×P(Y³e)=e×P(Y³e)
M(Y)³M(Ye)=e×P(Y³e).
Лемма позволяет сделать оценку вероятности наступления события по математическому ожиданию этой СВ.
Неравенство Чебышева. Для любой СВ с ограниченными первыми двумя моментами (есть МО и D) и для любого e>0:
Доказательство. По лемме Маркова: рассмотрим не отрицательную СВ Y
Y=(X-m)2 M(Y)=M(X-m)2=D(x)
P(|X-m|³e)=P((X-m)2³e2)=P(Y³e2)£M(Y)/e2=D(x)/e2.
Требуется только знание дисперсии СВ при любом законе распределения.
ЗБЧ в форме Чебышева. X1, X2, …, Xn – последовательность независимых СВ. Для любого e>0 и n®¥:
ЗБЧ в форме Бернулли. m – число успехов в серии из n последовательных испытаний Бернулли. P – вероятность успеха в каждом отдельном испытании. e>0:
ЗБЧ носит чисто качественный характер. В тех же условиях неравенство Чебышева позволяет получить количественную характеристику оценки вероятности.
Пример. Для определения вероятности события проведено 40000 опытов. События наблюдалось в m=16042 случаях. За вероятность события принимается относительная частота наступления события: m/n»0,4. Применяя неравенство Чебышева, оценить, с какой вероятностью можно гарантировать, что число 0,4, принятое за вероятность, отличается от истинной вероятности не больше, чем на 0,05.
Неизвестные p и q находим из системы уравнений:
=>Центральная предельная теорема Ляпунова.
Предмет внимания этой теоремы – распределение суммы большого числа СВ.
X=(x1+x2+…+xn)/n
Распределение суммы n независимых СВ в независимости от их законов распределения асимптотически сходятся к нормальному закону при неограниченном числе слагаемых и ограниченных двух первых моментах (МО и D).
Если si2=s2, то sх2=s2/n,
.D(x)=sх2=(s12+s22+…sn2)/n2
ЦПТ универсальны и справедливы как для НСВ, так и для ДСВ.
P(a<X<b)=Ф(t2)-Ф(t1).
t2=(b-mx)/sx t2=(a-mx)/sx
Sn=(X1+X2+…+Xn)/n
P(|Sn-m|<zs)=2Ф(z)
M(xk)=m D(xk)=s2
ЦПТ в интегральной форме Муавра-Лапласа.
Статистическое оценивание параметров распределения
Мы анализируем только выборки из генеральной совокупности. По средне выборочным параметрам находим параметры самой генеральной совокупности.
Задачи такого рода решаются методами проверки статистических гипотез и статистической оценки параметров распределения.
Прежде нужно получить и провести первичную обработку исходных экспериментальных данных.
Статистические ряды часто изображают графически в виде полигона, гистограммы, кумулятивной кривой F*(x).Полигон – ломаная линия, соединяющая в декартовой системе координат точки (xi,ni), (xi,mxi).
Кумулятивная кривая строится по точкам (xi,F*(xi)).
Гистограмма – на оси абсцисс – отрезки интервалов t, на этих интервалах строятся прямоугольники с высотой, равной относительной частоте признака. По гистограмме легко строится полигон.
И полигон, и гистограмма характеризуют функцию f*(x) – плотность вероятности.
НСВ – проблема выбора интервала варьирования h.
h выбирается, исходя из необходимости выявления характерных черт рассматриваемого распределения.
Правило Старджесса:
Как только характерные особенности распределения проявились, ставится вопрос об условиях, при которых сформировалось данное распределение – вопрос об однородности статистических данных.