Смекни!
smekni.com

Анализ эмпирического распределения (стр. 3 из 5)

Интервал Абсолютная частота (fi) Середина интервала (xi)
19,31429-49,68571 2 34,50 28060,13
49,68571-80,05714 3 64,87 23272,75
80,05714-110,4286 6 95,24 19979,69
110,4286-140,8 15 125,61 11207,44
140,8-171,1714 32 155,99 295,17
171,1714-201,5429 13 186,36 14509,73
201,5429-231,9143 4 216,73 16271,57
231,9143-262,2857 5 247,10 44322,46
Итого: 80 157918,93

Взвешенная дисперсия вариационного ряда:

Среднее квадратическое отклонение – это обобщающая характеристика размеров вариации признака в совокупности. Оно показывает, на сколько в среднем отклоняются конкретные варианты от их среднего значения.

Среднее квадратическое отклонение является корню квадратному из дисперсии.

Определим среднее квадратическое отклонение:

· По исходному ряду данных:

· По сгруппированным данным:


Чем меньше значение дисперсии и среднего квадратического отклонения, тем более однородна исследуемая совокупность.

Для сравнения вариаций различных признаков используются относительные показатели вариации, в частности, коэффициент вариации.

Коэффициент вариации представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической:

(2.8)

Коэффициент вариации исследуемого ряда данных равен:

Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и как характеристику однородности совокупности. Совокупность считается количественно однородной, если коэффициент вариации не превышает 33%.

Так как коэффициент вариации в данном случае составляет 27,18%, т.е. значительно меньше 33%, то исследуемая совокупность является количественно однородной.

4. ХАРАКТЕРИСТИКА СТРУКТУРЫ РАСПРЕДЕЛЕНИЯ

Структура распределения характеризуется такими показателями, как медиана, квартили и децили. Медиана ряда распределения была определена в разделе 2, она составила 153,45.

Аналогично медиане вычисляются значения признака, делящие совокупность на четыре равные по числу единиц части. Эти величины называются квартилями и обозначаются заглавной латинской буквой Q с подписным значком номера квартиля. Очевидно, что Q2 равно медиане распределения.

Значения признака, делящие ряд на пять равных частей, называют квинтилями, на десять частей – децилями, на сто частей – перцентилями.

Для расчёта квартилей применяются следующие формулы:

1) для несгруппированных данных:

Нижний (первый) квартиль (Lower quartile):

,
,
(4.1)

Верхний (третий) квартиль (Upper quartile):

,
,
(4.2)

2) в интервальном вариационном ряду распределения:

(4.3)

(4.4)

где:Q1 и Q3 – нижний и верхний квартили;

,
– нижние границы квартильных интервалов; h – величина группировочного интервала;
– абсолютные частоты квартильных интервалов;
– накопленные (кумулятивные) частоты интервалов, предшествующих квартильным.

Рассчитаем квартили распределения на основе сгруппированных данных (табл. 4.1).

Таблица 4.1 Исходные данные для расчета квартилей распределения регионов России по количеству легковых автомобилей на 1000 чел. населения за 2005 г.

Интервал Абсолютная частота (fi) Кумулятивная частота (Fi)
19,31429-49,68571 2 2
49,68571-80,05714 3 5
80,05714-110,4286 6 11
110,4286-140,8 15 26
140,8-171,1714 32 58
171,1714-201,5429 13 71
201,5429-231,9143 4 75
231,9143-262,2857 5 80
Итого: 80

Нижний квартиль распределения равен:

Верхний квартиль распределения:

Квартили, рассчитанные с помощью программы Statistica, немного отличаются от тех, что рассчитаны вручную по сгруппированным данным:

· Нижний квартиль равен 135,85.

· Верхний квартиль – 172,75.

5. ХАРАКТЕРИСТИКА ФОРМЫ РАСПРЕДЕЛЕНИЯ

Для дальнейшего изучения характера вариации используются средние значения разных степеней отклонений отдельных величин признака от его средней арифметической величины.

Эти показатели получили название центральных моментов распределения порядка, соответствующего степени, в которую возводятся отклонения (табл. 5.1), или просто моментов.

Таблица 5.1 Формулы для расчета центральных моментов

Порядок момента Формулы для расчета
для несгруппированных данных для сгруппированных данных
Первый
Второй
Третий
Четвертый

Согласно свойству средней арифметической центральный момент первого порядка равен нулю, второй центральный момент представляет собой дисперсию. Третий центральный момент используется для оценки асимметрии распределения, четвертый – для оценки эксцесса.

На основе момента третьего порядка можно построить показатель, характеризующий степень асимметричности распределения:


(5.1)

Этот показатель называют коэффициентом асимметрии. Он может быть рассчитан как по сгруппированным, так и по несгруппированным данным.

С помощью момента четвертого порядка характеризуется свойство рядов распределения, называемое эксцессом. Показатель эксцесса рассчитывается по формуле:

(5.2)

Исходные данные для расчета асимметрии и эксцесса приведены в табл. 5.2.

Таблица 5.2 Расчет ассиметрии и эксцесса для распределения регионов России по количеству легковых автомобилей на 1000 чел. населения за 2005 г.

Интервал Абсолютная частота (fi) Середина интервала (xi)
19,31429-49,68571 1 34,5 -3323682,13 393685400,9
49,68571-80,05714 3 58,12 -2049797,54 180540318,8
80,05714-110,4286 3 81,74 -1152941,93 66531323,0
110,4286-140,8 5 105,365 -306347,11 8373775,1
140,8-171,1714 14 128,99 896,48 2722,7
171,1714-201,5429 28 152,61 484749,46 16194790,2
201,5429-231,9143 14 176,23 1037801,06 66190981,2
231,9143-262,2857 6 199,855 4173022,64 392896041,5
Итого: 80 -1136299,06 1124415353,4

Коэффициент ассиметрии по сгруппированным данным:

Коэффициент ассиметрии на основе исходного ряда данных был рассчитан с помощью ППП Statistica и составил -0,341.

Коэффициент эксцесса на основе сгруппированных данных:

Коэффициент эксцесса, рассчитанный для несгруппированных данных, составил 1,075.

Сопоставим показатели, рассчитанные вручную по сгруппированным данным, и показатели, полученные с помощью программы Statistica на основе исходного ряда данных (табл. 5.3).