Статистика (стр. 10 из 21)

- Определение доверительной вероятности того, что ошибка репрезультативности не превысит некоторого заранее заданного значения;

- Расчет численности выборки, обеспечивающей с заданной вероятностью необходимую точность исследований.

2. Ошибка выборки.

Возникает из-за различий в вариации значений изучаемого признака у единиц выборочной и генеральной совокупности. Поскольку при соблюдении требований случайного отбора все единицы генеральной совокупности имеют равные шансы попасть в выборку, состав выборки может значительно изменяться при повторении испытаний. Соответственно будут меняться параметры выборки, и возникать ошибки выборки. Ошибки выборки неизбежны, они вытекают из сути метода. Ошибки выборки не могут быть постоянными при повторении отбора.

Ошибка выборки в статистике это некоторая средняя величина или обобщающая характеристика, ошибок полученных при многократном повторении испытаний.

W - P

- ошибка выборки;

- выборочная средняя;

- генеральная средняя;

W – доля единиц, обладающих изучаемым признаком в выборочной совокупности (выборочная доля);

P - доля единиц, обладающих изучаемым признаком в генеральной совокупности.

Величина ошибок зависит от способа отбора. В математической статистике доказано, что средняя ошибка выборки (математическое ожидание средней ошибки выборки) – это среднеквадратическое отклонение распределения выборочной средней величины.

Ошибка выборки определяется:

В математической статистике доказано, что средняя ошибка собственно случайного повторного отбор рассчитывается:

, где

- средняя ошибка выборки;

- дисперсия генеральной совокупности;

- численность выборки.

Если исследуется выборочная доля при повторном отборе

, где

- дисперсия биномиального распределения.

Результаты повторного отбора подчиняются закону биномиального распределения.

При бесповторном отборе результаты многократной выборки и распределения ошибок подчиняются гипергеометрическому распределению, и формула средней ошибки имеет вид:

, соответственно для выборочной доли

При выборках большой численности, когда

из массовых генеральных совокупностей (

) для расчета ошибок выборки можно использовать формулу повторного отбора.

В формулах средней ошибки выборки присутствует генеральная дисперсия. Однако, она, как правило, неизвестна. Если мы проводим выборку для того, чтобы изучить только часть совокупности, мы не можем знать генеральную дисперсию. Исключение составляют только выборки, проводимые для контроля результата сплошного наблюдения.

Однако, математической статистикой доказано, что если выборка производится из нормального распределения совокупности генеральная и выборочная дисперсия связаны между собой следующим образом:

s²- генеральная дисперсия; S²- выборочная дисперсия; n – численность выборки.

Из формулы видно, что достаточно большой выборке (n-1)®n, а

, откуда s²» S². Поэтому для расчета средних ошибок выборки на практике используют выборочные дисперсии.

Если многократно проводить выборки из одной и той же генеральной совокупности, то конкретному размеру ошибки выборки будет соответствовать та или иная статистическая вероятность ее появления.

Вероятности конкретного размера ошибок подсчитать невозможно (нецелесообразно), гораздо важнее знать, что ошибка наблюдений не выйдет за определенные пределы.