·Геометрическое распределение
Если Y – число посетителей, достаточное для того, чтобы один из них оказался
покупателем, то P(Y=1) = p*qn–1. (6)
·Распределение Пуассона
Закон распределения вероятностей дискретной СВ несет в себе всю информацию о ней и большего желать не приходится.
Не будет лишним помнить, что этот закон (или просто – распределение случайной величины) можно задать тремя способами:
· в виде формулы: например, для биномиального распределения при n=3 и p=0.5 вероятность значения суммы S=2 составляет 0.375;
· в виде таблицы значений величины и соответствующих им вероятностей:
· в виде диаграммы или, как ее иногда называют, гистограммы распределения.
Если нам известен закон распределения, то, просуммировав произведения значений суммы S на соответствующие каждому значению вероятности, мы найдем математическое ожидание этой суммы как дискретной случайной величины –
M(S) = SSi*P(Si). (7)
Математического ожидания – является “центром” распределения. Правда, речь идет вовсе не о делении оси допустимых значений самой СВ на две равные части. Поистине – первый показатель закона распределения “самый главный” или, на языке статистики, – центральный.
Итак, для СВ с числовым описанием математическое ожидание имеет достаточно простой смысл и легко вычисляется по законам распределения. Заметим также, что математическое ожидание – просто числовая величина (в общем случае не дискретная, а непрерывная) и никак нельзя считать ее случайной.
Другое дело, что эта величина зависит от внутренних параметров распределения (например, – значения вероятности р числа испытаний n биномиальном законе).
Так для приведенных выше примеров дискретных распределений математическое ожидание составляет (см. приложение 1).
Приходится признать, что математическое ожидание является удобным, легко вычислимым, но весьма неполным способом описания закона распределения. И поэтому требуется еще как–то использовать полную информацию о случайной величине, свернуть эту информацию каким–то иным способом.
D(X) = S (X i – M(X))2 * P(X i); (8) принято называть дисперсией распределения дискретной СВ.
Ясно, что для величин, имеющих единицу измерения, размерность математического ожидания и дисперсии оказываются разными. Поэтому намного удобнее оценивать отклонения СВ от центра распределения не дисперсией, а квадратным корнем из нее – так называемым среднеквадратичным отклонением s, т.е. полагать
s2 = D(X). (9)
Теперь оба параметра распределения (его центр и мера разброса) имеют одну размерность, что весьма удобно для анализа.
Отметим также, что формулу (7) часто заменяют более удобной
D(X) = S (Xi)2 *P(Xi) – M(X)2. (10)
Дисперсия, как и среднеквадратичное отклонение для конкретного закона распределения являются просто числами, в полном смысле показателями этого закона.
Полезно познакомиться с соотношениями математических ожиданий и дисперсий для упомянутых ранее стандартных распределений (см. приложение 1).
Математическое ожидание и дисперсию чаще всего называют моментами распределения. Это связано со способами вычисления этих параметров по известному закону распределения – через усреднение значений самой СВ или усреднение квадратов ее значений.
Иногда используют еще один показатель степени разброса СВ – коэффициент вариации V= s/ M(X), имеющий смысл при ненулевом значении математического ожидания.
Изучив сущность закона распределения и его виды, какие статистические оценки его существует, мы рассмотрим в следующем пункте.
1.2.Статистическая оценка законов распределения
Когда приходится изучать не единичные, а массовые случайные явления, необходимо прибегать к статистической оценке законов распределения. Этот метод предназначен для выявления закономерностей там, где на первый взгляд нет ничего, кроме совокупности отдельных фактов, наблюдений, измерений.
Если выборка объёма n из генеральной совокупности представительна, то элементы с одинаковыми значениями варианты будут приблизительно одинаково часто встречаться как в выборке, так и в генеральной совокупности. В этом случае естественно принять распределение X в выборке за приближенное распределение ее в генеральной совокупности, то есть считать дискретное распределение выборки Fn(x) приближением к теоретической функции распределения F(x). Пример приближения показан на рис.1.
Рис.1.Приближение к теоретической функции распределения F(x)
Основанием для такого приближения является так называемая основная теорема математической статистики, доказанная В.И. Гливенко
(11)Из этой теоремы следует, что при n→∞ с вероятностью, равной единице, верхняя граница отклонения |F(x)−F(x)| на всей оси x стремится к нулю. Тем самым гарантируется равномерное приближение Fn (x) к F(x) на всей оси x. Таким образом, исследуя функцию Fn (x), мы можем по ней приближено оценить теоретическую функцию распределения случайной величины.
Основные свойства точечных оценок
Для того чтобы оценка имела практическую ценность, она должна обладать следующими свойствами:
1. Оценка параметра q называется несмещенной, если ее математическое ожидание равно оцениваемому параметру q , т.е.
М = q . (12)
Если равенство (12) не выполняется, то оценка может либо завышать значение q (М > q ), либо занижать его (М < q ) . Естественно в качестве приближенного неизвестного параметра брать несмещенные оценки для того, чтобы не делать систематической ошибки в сторону завышения или занижения.
2. Оценка параметра q называется состоятельной, если она подчиняется закону больших чисел, т.е. сходится по вероятности к оцениваемому параметру при неограниченном возрастании числа опытов (наблюдений) и, следовательно, выполняется следующее равенство:
, (13)
где e > 0 сколько угодно малое число.
Для выполнения (13) достаточно, чтобы дисперсия оценки стремилась к нулю при , т.е.
(14)
И кроме того, чтобы оценка была несмещенной. От формулы (14) легко перейти к (13) , если воспользоваться неравенством Чебышева.
Итак, состоятельность оценки означает, что при достаточно большом количестве опытов и со сколько угодно большой достоверностью отклонение оценки от истинного значения параметра меньше любой наперед заданной величины. Этим оправдано увеличение объема выборки.
Так как - случайная величина, значение которой изменяется от выборки к выборке, то меру ее рассеивания около математического ожидания q будем характеризовать дисперсией D . Пусть и - две несмещенные оценки параметра q, т.е. M = q и M = q , соответственно D и D и, если D < D , то в качестве оценки принимают .
3. Несмещенная оценка , которая имеет наименьшую дисперсию среди всех возможных несмещенных оценок параметра q, вычисленных по выборкам одного и того же объема, называется эффективной оценкой.
На практике при оценке параметров не всегда удается удовлетворить одновременно требованиям 1, 2, 3. Однако выбору оценки всегда должно предшествовать ее критическое рассмотрение со всех точек зрения. При выборке практических методов обработки опытных данных необходимо руководствоваться сформулированными свойствами оценок.