Теория вероятностей изучает случайные события и базируется на следующих основных показателях. Совокупность множества однородных событий случайной величины х составляет первичный статистический материал. Совокупность, содержащая самые различные варианты массового явления, называют генеральной совокупностью или большой выборкой N. Обычно изучают лишь часть генеральной совокупности, называемой выборочной совокупностью или малой выборкой N1. Вероятностью р(х) события х называют отношение числа случаев N(х), которые приводят к наступлению события х к общему числу возможных случаев N:
Теория вероятностей рассматривает теоретические распределения случайных величин и их характеристики.
Математическая статистика занимается способами обработки и анализа эмпирических событий. Эти две науки составляют единую математическую теорию массовых случайных процессов, широко применяемую в научных исследованиях.
В математической статистике большое значение имеет понятие о частоте событий
, представляющего собой отношение числа случаев n(x), при которых имело место событие к общему числу событий n:При неограниченном возрастании числа событий частота y(x) стремится к вероятности р(х). Частота
характеризует вероятность появлений случайной величины и представляет собой ряд распределения (рис.1), а плавная кривая – закон распределения F(x).Вероятность случайной величины (события) – это количественная оценка возможности ее появления. Достоверное событие имеет вероятность р=1, невозможное событие р=0. Следовательно, для случайного события
0≤ р(х) ≤ 1, а сумма вероятностей всех возможных значений:
В исследованиях иногда недостаточно знать функцию распределения. Необходимо еще иметь ее характеристики: среднеарифметическое и математическое ожидания, дисперсию, размах ряда распределения.
Пусть среди n событий случайная величина х1 повторяется n1 раз, величина х2 – n2 раза и т.д. Тогда среднеарифметическое значение х имеет вид:
Размах можно использовать для ориентировочной оценки вариации ряда событий:
где: - максимальное и минимальное значение измерительной величины или погрешности.Если вместо эмпирических частот y1 ….. yn принять их вероятности
р1 …..рn, то это даст важную характеристику распределения – математическое ожидание:
Для непрерывных случайных величин математическое ожидание определяется интегралом:
т.е. оно равно действительному значению хд наблюдаемых событий. Таким образом, если систематические погрешности измерений полностью исключены, то истинное значение измеряемой величины равно математическому ожиданию, а соответствующая ему абсцисса называется центром распределения. Площадь, расположенная под кривой распределения (рис.1), соответствующая единице, т.к. кривая охватывает все результаты измерений. Для одной и той же площади можно построить большое количество кривых распределения, т.е. они могут иметь различное рассеяние. Мерой рассеяния (точности измерений) является дисперсия или среднеквадратичное отклонение. Таким образом, дисперсия характеризует рассеивание случайной величины по отношению к математическому ожиданию и вычисляется по формуле:
Важной характеристикой теоретической кривой распределения является среднеквадратичное отклонение:
Коэффициент вариации
применяется для сравнения интенсивности рассеяния в различных совокупностях, определяется в относительных единицах (kв <1).
Основной задачей статистики является подбор теоретических кривых по имеющемуся эмпирическому закону распределения. Пусть в результате n измерений случайной величины получен ряд ее значений х1, х2, х3, …., хn. При первичной обработке таких рядов их вначале группируют в интервалы и устанавливают для каждого из них частоты и
. По значениям хiи строят ступенчатую гистограмму частот и вычисляют характеристики эмпирической кривой распределения. Основными характеристиками эмпирического распределения являются:среднеарифметическое значение:
дисперсия:
Значения этих величин соответствуют величинам
и теоретического распределения.Уравнение
соответствует функции нормального распределения при m(x) 0 (рис. 2, а). Если совместить ось ординат с точкой m, т.е. m(x)=0 (рис.2,б), и принять , то знаки нормального распределения описываются зависимостью:Для оценки рассеяния обычно пользуются величиной
. Чем меньше , тем меньше рассеяние, т.е. большинство наблюдений мало отличается друг от друга (рис.3). С увеличением рассеяние возрастает, вероятность появления больших погрешностей увеличивается, а максимум кривой распределения (ордината), равная уменьшается. Поэтому величину при или называют мерой точности.Таким образом, чем меньше
, тем больше сходимость результатов измерений, а ряд измерений более точен, среднеквадратичное отклонение определяет закон распределения. Отклонения + и - соответствуют точкам перегиба кривой (заштрихованная площадь на рис. 3). В общем случае для предела вероятность того, что событие хiпопадает в данный предел, вычисляется по распределению Лапласа:При анализе многих случайных дискретных процессов пользуются распределением Пуассона. Так, вероятность появления числа событий х=1,2,3,… в единицу времени определяется законом Пуассона (рис.4) и подсчитывается по формуле:
Где х – число событийза данный отрезок времени t;
- плотность, т.е. среднее число событий за единицу времени; - число событий за время t, = mРаспределение Пуассона относят к редким событиям, т.е. р(х) – вероятность того, что событие в период какого-то испытания произойдет х раз при очень большом числе измерений m. Для закона Пуассона дисперсия равна математическому ожиданию числа наступления события за время t, т.е.