Смекни!
smekni.com

Основные понятия статистики (стр. 7 из 13)

В интервальном вариационном ряду для определения медианы сначала нужно найти медианный интервал – первый по счету интервал, в котором накопленная частота равна или превышает полусумму частот вариационного ряда. После этого медиана определяется по формуле

,

где

– нижняя граница медианного интервала;

– величина медианного интервала;

– накопленная частота интервала, предшествующего медианному;

– частота медианного интервала.

Пример. По данным примера 5.3 определить медиану интервального ряда.

Медианным является интервал (1500-1600), так как это первый по счету интервал, сумма накопленных частот которого (115) больше полусуммы накопленных частот интервального ряда (0.5∙210 = 105). Подставив данные примера в формулу для медианы интервального ряда, получим

.

В математической статистике используют структурные характеристики, делящие вариационный ряд на большее число частей, – квантили – показатели дифференциации признаков по частотам. Различают несколько видов квантилей.

Квартили – значения признака, которые делят вариационный ряд на четыре равные части. Второй квартиль равен медиане, первый и третий вычисляются аналогично расчету медианы. При расчете i-го квартиля сначала по относительным частотам определяют соответствующий квартильный интервал – первый по счету интервал, накопленная частота которого больше

(n – сумма частот). Затем значение квартиля рассчитывают по формуле, аналогичной формуле для нахождения медианы

, i =1, 2, 3,

где i– номер квартильного интервала;

– нижняя граница i-го квартильного интервала;

– величина i-го квартильного интервала;

– накопленная частота интервала, предшествующего i-му квартильному интервалу;

– частота i-го квартильного интервала.

Отношение третьего и первого квартилей называется квартильным коэффициентом

=

и показывает, во сколько раз значение признака у четверти вариантов, имеющих наибольшие значения признака, превышает значение признака у другой четверти с наименьшими значениями.

Значения признака, которые делят вариационный ряд на десять равных частей, называются децилями. Расчет значений децилей проводится аналогично расчету квартилей. Отношение девятого и первого децилей – децильный коэффициент

=
показывает, во сколько раз величина признака у 10% совокупности с наибольшими значениями превышает такую же величину у 10% совокупности с наименьшими значениями признака.

В статистике используются также перцентили – значения признака, которые делят вариационный ряд на сто равных частей.

В ряде случаев в математической статистике вычисляют показатели формы распределения частот по вариантам: асимметрию и эксцесс. Характеристика симметричности распределения – коэффициент асимметрии – рассчитывается по формуле


,

где

– центральный момент третьего порядка;

– куб среднего квадратического отклонения.

Если варианты распределены симметрично относительно средней величины

, т.е. равноудаленные от
варианты имеют одинаковые частоты, коэффициент асимметрии равен нулю. Если
< 0, в вариационном ряду преобладают варианты, которые меньше, чем средняя величина. В этом случае говорят о наличии левосторонней асимметрии. И, наоборот, при
> 0 преобладают варианты, которые больше
. Это указывает на правостороннюю симметрию.

Пример. Рис. 1 иллюстрирует зависимость вида кривой распределения от асимметрии.

Рис. 1

Для симметричных распределений рассчитывается также эксцесс распределения – показатель островершинности распределения. Эксцесс рассчитывается по формуле


,

где

– центральный момент четвертого порядка.

При расчете экцесса эталоном является нормальное распределение, для которого

, и, следовательно
. Для распределений, у которых
, кривая более островершинная, чем нормальная кривая. Если
, кривая будет более плосковершинной.

Пример. Рис. 2 иллюстрирует зависимость вида кривой распределения от эксцесса

Рис. 2

Контрольные вопросы

1. Что называется средней величиной?

2. Какие виды средних величин вы знаете?

3. Какие виды средней арифметической вам известны?

4. Как вычисляется средняя геометрическая величина?

5. Что представляет собой средняя гармоническая?

6. Чем характеризуется понятие «размах вариации»?

7. Что такое среднее линейное отклонение?

8. Что такое дисперсия и как она может быть вычислена?

9. Что называется средним квадратическим отклонением?

10.Что называется коэффициентом вариации?

11.Что такое мода?

12.Как определяется мода для дискретных и интервальных вариационных рядов?

13.Что такое медиана?

14.Как определяется медиана для дискретных и интервальных вариационных рядов?


4.Графическое представление вариационных рядов

В математической статистике широко используется геометрическая интерпретация результатов первичной статистической обработки экспериментальных данных. Графическое представление сгруппированного дискретного вариационного ряда в осях – признак и частота - называется полигоном частот. Графическое представление интервального вариационного ряда в виде прямоугольников, с основаниями, равными длине интервалов и с высотой, равной соответствующей относительной частоте, называется гистограммой.

Пример. Имеются данные наблюдения над числом посетителей сайта академии в течение 40 дней:

70, 75, 100, 120, 75, 60, 100, 120, 70, 60, 65, 100, 65, 100, 70, 75, 60, 100, 100, 120, 70, 75, 70, 120, 65, 70, 75, 70, 100, 100, 120, 120, 100, 75, 75, 70, 70, 100, 100, 75.

Число посетителей Х является дискретным признаком, полученные данные представляют собой выборку из n = 40 наблюдений.

Требуется составить вариационный ряд, найти относительные частоты, построить эмпирическую функцию плотности распределения и эмпирическую функцию распределения.

Сначала составим вариационный ряд:

60, 60, 60, 65, 65, 65 70, 70, 70, 70, 70, 70, 70, 75, 75, 75, 75, 75, 75, 75, 75, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 100, 120, 120, 120, 120, 120, 120.

Сгруппированный вариационный ряд представим в виде таблиц

Номер группы i 1 2 3 4 5 6
Число посетителей хi 60 65 70 75 100 120
Частота ni 3 3 9 8 11 6
Относительная частота pi* 0.075 0.075 0.225 0.2 0.275 0.15
Графическое изображение результатов представлено на рис.1 и рис.2

Рис. 3

Рис.4

Построим эмпирическую функцию распределения. Исходными данными для её построения являются множество значений признака и множество относительных частот:

хi 50 60 65 70 75 100 120
pi* 0 0.075 0.075 0.225 0.2 0.275 0.15
xi 50 60 65 70 75 100 120
Pi* 0 0,075 0,075 0,225 0,200 0,275 0,150
F ( xi ) 0 0,075 0,15 0,375 0,575 0,85 1