Используя определение дисперсии, получаем:
и в силу (23.2), следовательно,
,(23.4)
т.е. выборочная дисперсия является смещенной оценкой дисперсии генеральной совокупности.
Замечание 2. Оценку (23.4) можно исправить так, чтобы она стала несмещенной
(23.5)
Обычно оценку называют исправленной выборочной дисперсией. Действительно,
тогда
Дробь называют поправкой Бесселя. При малых n поправка Бесселя значительно отличается от 1. При n > 50 практически нет разницы между и .
Замечание 3. Можно показать, что оценки и являются состоятельными и не являются эффективными.
Несмещенной, состоятельной и эффективной оценкой является оценка
(23.6)
в случае, когда математическое ожидание m известно
.
Изучавшиеся ранее оценки неизвестного параметра являются точечными: мы старались судить о значении неизвестного числа или вектора q по значению оценки , принятом ею, как только известна статистическая выборка ( ). Однако, поскольку оценка сама является случайной величиной, её выборочное значение заведомо не совпадает с константой q. Имея в виду это обстоятельство, предпочтительнее стремиться указывать не точное значение оцениваемого параметра, а некоторый интервал, содержащий в себе значение параметра. Границы такого интервала должны определяться доступной нам информацией - выборкой из генеральной совокупности, то есть они сами случайны, и поэтому есть смысл говорить о вероятности того, что значение параметра находится внутри интервала.
Определение 24.1. Пусть генеральная совокупность описывается случайной величиной x, распределение которой зависит от скалярного параметра q. Пусть, далее, и две функции выборки такие, что всегда и
.
( ) со случайными границами называют доверительным интервалом для неизвестного параметра q с доверительной вероятностью b.
Число a = 1-b называют уровнем значимости интервала.
Стараясь иметь как можно более достоверные выводы, границы доверительного интервала выбирают таким образом, чтобы доверительная вероятность b была как можно ближе к 1.
Схематически процесс построения доверительного интервала можно описать следующим образом.
Пусть - несмещенная оценка параметра q.
Выберем доверительную вероятность b. Значение выражения «b как можно ближе к 1» относительно, оно находится вне границ математики и определяется лицом, производящим статистические исследования. Обычно выбирают b равным 0,9; 0,95; 0,99.
Пусть, далее, можно найти такое число e > 0, что
.(24.1)
Записав (24.1) в виде
,
видим, что интервал ( ) является доверительным интервалом для параметра q с уровнем значимости a = 1-b.
Практически вопрос о построении доверительного интервала связан с возможностью нахождения распределения оценки , а это, в свою очередь, зависит от распределения генеральной совокупности.
Пример 24.1. Построение доверительного интервала для математического ожидания нормальной генеральной совокупности при известной дисперсии.
Пусть генеральная совокупность x распределена по нормальному закону с параметрами (q,s2), где s2 (дисперсия) известно. Мы уже знаем, что наилучшей в смысле несмещенности, состоятельности и эффективности оценкой неизвестного математического ожидания q нормального закона является выборочное среднее
.
В продвинутом курсе теории вероятностей доказывается, что нормальное распределение обладает свойством устойчивости : если независимые случайные величины x, h распределены нормально с параметрами ( ) и ( ) соответственно, то их сумма x + h распределена нормально с параметрами ( ).
Используя это утверждение в нашем случае, заключаем, что распределена нормально с параметрами ( ), а нормированное выборочное среднее подчинено нормальному закону с параметрами (0,1).
Это означает, что
, где .
Функция Ф(z) нам уже встречалась, её значения табулированы.
Выберем теперь доверительную вероятность b и обозначим корень уравнения Ф( ) = b/2.
После этого рассмотрим равенства
, которые свидетельствуют о том, что интервал
является доверительным для параметра q с доверительной вероятностью b ( и уровнем значимости a = 1 - b).
Приведем часть из таблицы значений (прил. 2) для некоторых наиболее употребительных значений b.
Таблица 24.1 (Зависимость от доверительной вероятности)
b | 0,9 | 0,925 | 0,95 | 0,99 |
1,65 | 1,78 | 1,96 | 2,89 |
Обозначим половину ширины доверительного интервала.
Замечаем, что:
1) при фиксированной доверительной вероятности b ширина доверительного интервала уменьшается с ростом числа наблюдений n как величина порядка ( при увеличении, например, числа наблюдений в 100 раз ширина интервала уменьшится в 10 раз);
2) поскольку Ф(z) возрастает с ростом z, то увеличение доверительной вероятности, при всех прочих постоянных параметрах, приводит к расширению доверительного интервала.
Пример 24.2. Желая узнать, сколько часов в неделю дети проводят у телевизора, социологическая служба обследовала 100 учеников некого города, в результате чего оказалось, что в среднем это число равно . Из прошлой практики известно, что стандартное отклонение ( ) генеральной совокупности равно 6 (часов). Найдем доверительный интервал с доверительной вероятностью 0,95 для числа часов в неделю, проводимых ребенком у телевизора.
Поскольку b = 0,95, из табл. 24.1 находим , и границы интервала доверия будут такими:
,