Раздел статистики, в которой изучается проблема получения информации о генеральной совокупности по выборочным данным, называется статистические выводы. Этот раздел можно разделить на два отдела: оценивания параметров и проверка гипотез.
Для оценивания параметра распределения можно использовать несколько выборочных статистик. Например, оценка генерального среднего может служить и выборное среднее
Иногда становится важным и такое свойство оценки как простота вычислений, малое время обработки. Можно выбрать такую оценку вместо более эффективной, но и более дорогой и длительной.
Обычно оценку случайний величины (статистику) обозначают большими латинскими буквами (
Признаки каждого объекта выборки объема n можно считать независимыми случайными величинами Хi (i=1,2,…,n) имеющими одинаковые законы распределения (одинаковые параметры m и s). Точечной оценкой математического ожидания будет статистика
Случайную величину
Если данные выборки сгруппировать в вариационный ряд, то
где xi— значение варианты для дискретного вариационного ряда или средина классового интервала для интервального вариационного ряда; mi – частота варианта или классовая частота.
Точечной оценкой дисперсии s2 признака, при неизвестной величине математического ожидания m является статистика
Значение этой статистики s2 для конкретной выборки равно
Удобно пользоваться формулой
где
Точечной оценкой стандартного отклонения (среднего квадратического отклонения) s является статистика
Точечной оценкой стандартного отклонения выборочной средней
Значение этой статистики для конкретной выборки равно
Подчеркнем, что s является характеристикой отдельного измерения, а
Если данные выборки представлены интервальным вариационным рядом, то для большего объема n и малого числа классов k.
Оценка дисперсии признака является завышенной на величину
где Dx— ширина классового интервала.
Если объем генеральной совокупности N, а объём выборки n соизмерим с N (
Рассмотрим пример. Результаты измерения признака Х из элементов выборки объёма
№ интервала, i | Интервал | Середина интервала, xi | Частота, mi | mixi | mixi2 |
1 | [76;85] | 80 | 2 | 160 | 12800 |
2 | [86;95] | 90 | 5 | 450 | 40500 |
3 | [96;105] | 100 | 17 | 1700 | 170000 |
4 | [106;115] | 110 | 25 | 2750 | 302500 |
5 | [116;125] | 120 | 45 | 5400 | 648000 |
6 | [126;135] | 130 | 27 | 3510 | 456300 |
7 | [136;145] | 140 | 21 | 2940 | 411600 |
8 | [146;155] | 150 | 3 | 450 | 67500 |
9 | [156;165] | 160 | 1 | 160 | 25600 |
Сумма | 146 | 17520 | 2134800 |
По формуле находим выборочное среднее
Из расчета видно, что поправка Шеппарда незначительна. По формуле определяем стандартное отклонение выборочной средней
Такие величины как выборочные мода и медиана также могут служить для оценки среднего генеральной совокупности (особенно если генеральное распределение симметрично). Разность выборочного среднего
Для двухмерной случайной величины выборка объёма n состоит из последовательности n пар чисел
Для коэффициента корреляции точечной оценкой служит выражение
Для нахождения точечной оценки неизвестного параметра используется также метод наибольшего правдоподобия. Он состоит в том, что в качестве наиболее правдоподобного значения параметра Q берут то его значение Q, при котором вероятность получить в n опытах данную выборку
Эта функция имеет максимум при
Пусть
,
Уравнение для определения l имеет вид
решение которого даёт известный результат
математический дисперсия выборка дискретный