Смекни!
smekni.com

Математическая статистика (стр. 4 из 4)

Раздел статистики, в которой изучается проблема получения информации о генеральной совокупности по выборочным данным, называется статистические выводы. Этот раздел можно разделить на два отдела: оценивания параметров и проверка гипотез.

Для оценивания параметра распределения можно использовать несколько выборочных статистик. Например, оценка генерального среднего может служить и выборное среднее

, и медиана
, и мода. Наилучшая оценка должна обладать такими свойствами как: несмещенность, эффективность и состоятельность. Для несмещенности необходимо, что бы выборочная статистика имела математическое ожидание равное оцениваемому параметру. Если имеется две несмещенные оценки, то из них следует выбирать ту, которая имеет меньшую выборочную дисперсию (она считается более эффективной). Оценка должна также быть состоятельной. Это означает, что с ростом объема выборки, дисперсия оценки должна стремится к нулю.

Иногда становится важным и такое свойство оценки как простота вычислений, малое время обработки. Можно выбрать такую оценку вместо более эффективной, но и более дорогой и длительной.

Обычно оценку случайний величины (статистику) обозначают большими латинскими буквами (

), значение оценки из данных выборки – соответствующими малыми латинскими буквами (
), действительное значение параметра генеральной совокупности — малыми буквами греческого алфавита (
).

Признаки каждого объекта выборки объема n можно считать независимыми случайными величинами Хi (i=1,2,…,n) имеющими одинаковые законы распределения (одинаковые параметры m и s). Точечной оценкой математического ожидания будет статистика

.

Случайную величину

называют усредненным значением признака выборочным средним. Значение
для конкретной выборки будет среднее арифметическое из данных выборки

.

Если данные выборки сгруппировать в вариационный ряд, то

находят по формуле

,

где xi— значение варианты для дискретного вариационного ряда или средина классового интервала для интервального вариационного ряда; mi – частота варианта или классовая частота.

Точечной оценкой дисперсии s2 признака, при неизвестной величине математического ожидания m является статистика

.

Значение этой статистики s2 для конкретной выборки равно

.

Удобно пользоваться формулой

,

где

или
.

Точечной оценкой стандартного отклонения (среднего квадратического отклонения) s является статистика

.

Точечной оценкой стандартного отклонения выборочной средней

будет статистика

Значение этой статистики для конкретной выборки равно

.

Подчеркнем, что s является характеристикой отдельного измерения, а

— характеристикой совокупности измерений.

Если данные выборки представлены интервальным вариационным рядом, то для большего объема n и малого числа классов k.

Оценка дисперсии признака является завышенной на величину

, называемой поправкой Шеппарда с учетом этой поправки имеем

,

где Dx— ширина классового интервала.

Если объем генеральной совокупности N, а объём выборки n соизмерим с N (

), то дисперсия выборочной средней
рассчитывается по формуле

.

Рассмотрим пример. Результаты измерения признака Х из элементов выборки объёма

представлены интервальным вариационным рядом с
:
№ интервала, i Интервал Середина интервала, xi Частота, mi mixi mixi2
1 [76;85] 80 2 160 12800
2 [86;95] 90 5 450 40500
3 [96;105] 100 17 1700 170000
4 [106;115] 110 25 2750 302500
5 [116;125] 120 45 5400 648000
6 [126;135] 130 27 3510 456300
7 [136;145] 140 21 2940 411600
8 [146;155] 150 3 450 67500
9 [156;165] 160 1 160 25600
Сумма 146 17520 2134800

По формуле находим выборочное среднее

. Среднее от х2 равно
. Стандартные отклонение S находим с учетом поправки Шеппарда

Из расчета видно, что поправка Шеппарда незначительна. По формуле определяем стандартное отклонение выборочной средней

.

Такие величины как выборочные мода и медиана также могут служить для оценки среднего генеральной совокупности (особенно если генеральное распределение симметрично). Разность выборочного среднего

и выборочной медианы (или моды) может быть оценкой коэффициента асимметрии. Статистики для моды и медианы определяются выборочными значениями. Например, для доли определенных элементов в генеральной совокупности (это вероятность Р случайно выбрать такой элемент) наилучшей точечной оценкой будет статистика
где Х число этих элементов в выборке n, то есть доля тех же элементов в выборке.

Для двухмерной случайной величины выборка объёма n состоит из последовательности n пар чисел

. Точечной оценкой корреляционного момента является статистика

Для коэффициента корреляции точечной оценкой служит выражение

.

Для нахождения точечной оценки неизвестного параметра используется также метод наибольшего правдоподобия. Он состоит в том, что в качестве наиболее правдоподобного значения параметра Q берут то его значение Q, при котором вероятность получить в n опытах данную выборку

является максимально большой. Каждая из величин Xiимеет плотность вероятности
. Функция правдоподобия определяется соотношением

.

Эта функция имеет максимум при

, где
является решением управления

или
.

Пусть

—выборка из распределения Пуассона
. Тогда

,

.

Уравнение для определения l имеет вид

,

решение которого даёт известный результат

математический дисперсия выборка дискретный

.