Смекни!
smekni.com

Теория вероятности и математическая статистика 4 (стр. 9 из 18)

Лекция №10. Предмет математической статистики. Генеральная и выборочная совокупности. Вариационные ряды и их характеристики

Математическая статистика – раздел высшей математики, изучающий методы сбора, систематизации и обработки результатов случайных массовых явлений с целью выявления существующих закономерностей.

Вся подлежащая изучению совокупность объектов наблюдений называют генеральной совокупностью. Иными словами, совокупность всех возможных, всех мыслимых, значений исследуемой случайной величины. Понятие генеральной совокупности аналогично понятию случайной величины (закону распределения, вероятностному пространству).

Та часть объектов, которая отобрана для непосредственного изучения из генеральной совокупности, называется выборочной совокупностью или выборкой. Число объектов в генеральной или в выборочной совокупности называют их объемом

.

Основная форма представления выборочной совокупности – вариационные ряды. Вариационный ряд – это ранжированные в порядке возрастания или убывания ряд вариантов с соответствующими им весами (частотами и частостями). Различные значения признака (случайной величины

) называют вариантами (обозначаем их через
). Число, показывающее, сколько раз встречается в выборке вариант
, называют частотой варианта
. Отношение числа вариантов к объему выборки (или общему числу наблюдений)
- называют частостью варианта и обозначают
:

.

Частости и частоты еще называют весами.

Кроме частости и частоты используют понятие накопленной частости и частоты, которые обозначают

и
соответственно. Накопленная частота показывает, сколько вариантов признака приняли значение меньше заданного значения
.

Если варианты не отличаются друг от друга меньше определенного значения- то такой ряд называют дискретным.

Если варианты отличаются друг от друга на сколь угодно малую величину, то такой ряд называют непрерывным.

Для построения непрерывного вариационного ряда рекомендуемое число интервалов

вычисляют по формуле Стерджеса
, а ширина интервала
равна:

,

где

- разность между наибольшим и наименьшим значением признака. За начало первого интервала рекомендуется принимать величину
. Начало второго интервала совпадает с концом второго
и т.д., до тех пор, пока начало
-ого интервала не будет больше
.

Графически вариационные ряды изображают в виде полигона и гистограммы.

Полигон существуют для дискретного вариационного ряда в виде зависимости

от
или
от
.Гистограмма представляет собой графики прямоугольников шириной равной величине интервала
и высотой равной частоте или частости попадания (
или
) признака в этот интервал.

Зависимость между

или
и
называют кумулятивной кривой или кумулятой. По своей сути полигон является статистическим аналогом или оценкой многоульника распределения случайной величины. Гистограмма – эмпирическая функции плотности распределения, кумулята - эмпирическая функция распределения.

Вариационные ряды характеризуются показателями средних значений и вариации. К средним значениям относят:

- средняя арифметическая

вариационного ряда, равная:

,

где

- варианты дискретного ряда или середины интервалов интервального ряда,
- соответствующие частоты или частости вариантов или интервалов.

- средней степенной

- ого порядка:

.

При

получаем среднюю арифметическую;

при

- среднюю гармоническую;

при

( после открытия неопределенности
):

- среднюю геометрическую;

при

:

- средняя квадратическая.

Перечисленные средние относят к аналитическим. Кроме них в статистическом анализе применяют структурные или порядковые средние. К ним относят медиану и моду.

Медианой вариационного ряда называется значение признака, приходящееся на середину ранжированного ряда наблюдений.

Для дискретного вариационного ряда с нечетным числом членов медиана равна серединному варианту, а для ряда с четным числом членов – полусумме двух серединных вариантов. Приближенно медиану можно найти с помощью кумуляты как значение признака, для которого

или
.

Модой вариационного ряда называют вариант, которому соответствует наибольшая частота.

К показателям вариации вариационных рядов относят:

- вариационный размах

, равный разности между наибольшим и наименьшим вариантами ряда:

;

- выборочная (эмпирическая) дисперсия

, равная средней арифметической квадратов отклонений вариантов от их средних арифметических:

или
;

- среднее квадратическоеотклонение

:

;

- коэффициент вариации

, равный процентному отношению среднего квадратического отклонения к средней арифметической:

Лекция 11. Связь между генеральной и выборочной совокупностью.

Понятие генеральной совокупности в определенном смысле аналогично понятию случайной величины (закону распределения, вероятностному пространству). Выборку можно рассматривать, как некий эмпирический аналог генеральной совокупности.

Средние арифметические распределения признака в генеральной и выборочной совокупностях называются соответственно генеральной и выборочной средними.