Используя вышеуказанные данные по среднемесячной начисленной зарплате составим ранжированный ряд (таблица 2)
Таблица 2. –Ранжированный ряд распределения районов Пермского края по среднемесячной начисленной заработной плате
Шифр района | Ранги районов | Варианты ряда, x | Интенсивность нарастания признака ∆хi |
Суксунский | 1 | 2854 | 69 |
Уинский | 2 | 2923 | 79 |
Б.-Сосновский | 3 | 3002 | 3 |
Еловский | 4 | 3005 | 41 |
Оханский | 5 | 3046 | 30 |
Сивинский | 6 | 3076 | 2 |
Кишертский | 7 | 3078 | 98 |
Куединский | 8 | 3176 | 64 |
Ильинский | 9 | 3240 | 3 |
Ординский | 10 | 3243 | 33 |
Чердынский | 11 | 3276 | 198 |
Частинский | 12 | 3474 | 5 |
Кунгурский | 13 | 3479 | 152 |
Карагайский | 14 | 3631 | 176 |
Соликамский | 15 | 3807 | 134 |
Октябрьский | 16 | 3941 | 376 |
Бардымский | 17 | 4317 | 234 |
Березовский | 18 | 4551 | 272 |
Усольский | 19 | 4823 | 108 |
Верещагинский | 20 | 4931 | 160 |
Очерский | 21 | 5091 | 12 |
Красновишерский | 22 | 5103 | 289 |
Горнозаводский | 23 | 5392 | 14 |
Нытвенский | 24 | 5406 | 61 |
Чернушинский | 25 | 5467 | 715 |
Осинский | 26 | 6182 | 69 |
Пермский | 27 | 6251 |
Для более наглядного представления полученной информации представим ранжированный ряд в виде графика:
График 1. Ранжированный ряд распределения районов Пермского края по среднемесячной начисленной заработной плате
Теперь рассчитаем среднее значение x:
X = ∑X׃N=109762׃27= 4065, 37,
ф
Используя формулу, рекомендованную американским статистиком Стержессом, определим число групп в вариационном ряду:
k=1+3,32 lg n, где
n – численность совокупности.
k= 1+5,75=5,75
Таким образом, оптимальное количество групп в нашем вариационном ряду составит 6.
Рассчитаем размер интервала (i):
i = (Xmax - Xmin)׃ k;
(6251 – 2854)׃ 6 = 566,17
Используя, полученное нами, количество групп и размер интервала, подсчитаем количество районов в группах, структуру их распределения, а также кумулятивный ряд распределения районов. Полученные данные представим в таблице 3.
Для более наглядного представления информации создадим гистограмму интервального ряда распределения районов по объему среднемесячной начисленной зарплаты (рис. 1).
Таблица 3. - Интервальный ряд распределения районов по среднемесячной начисленной зарплате
Группы районов по среднемесячной начисленной зарплате | Количество районов в группах | Структура распреде ления районов | Кумулятивный ряд распределения районов | Середина интервала | |
по частотам | по частостям | ||||
2854-3420 | 11 | 40,7 | 11 | 40,7 | 3137 |
3420-3986 | 5 | 18,5 | 16 | 59,3 | 3703 |
3986-4552 | 2 | 7,4 | 18 | 66,7 | 4269 |
4552-5118 | 4 | 14,8 | 22 | 81,5 | 4835 |
5118-5684 | 3 | 11,1 | 25 | 92,6 | 5401 |
5684-6251 | 2 | 7,4 | 27 | 100,0 | 5967,5 |
Итого | 27 | 100 | 27312,5 |
Рис. 1. – Гистограмма интервального ряда распределения районов Пермского края по объему среднемесячной начисленной заработной плате
Так как при группировке значения осредняемого признака определены интервалами, то рассчитаем среднюю арифметическую по формуле:
x =∑ x j f j / ∑ f j,
где f j – количество районов в группах,
x j – середина интервала.
x = (3137∙11+3703∙5+4269∙2+4835∙4+5401∙3+5967,5∙2)׃27=4038,44 руб.
Определим величину признака, которая встречается в изучаемом ряду чаще всего, т.е. моду. Для этого нам понадобится следующая формула:
Мо =x0 + (f Mo – f Mo-1) i /f Mo –f Mo-1 + f Mo –f Mo+1 = 3220.34,
x0 – нижняя граница модального интервала;
f Mo– частота в модальном интервале;
f Mo-1– частота в предыдущем интервале;
f Mo+1–частота в последующем интервале.
Теперь перейдем к величине, которая описывает количественно структуру, строение вариационного ряда – медиане, которую можно рассчитать по формуле:
Мe = xe +i ( 0,5∑ f – fMe-1) / f Me,
где xe – низшая граница интервала, в котором находится медиана;
fMe-1 – накопленная частота в интервале, предшествующем медианному;
f Me – частота в медианном интервале.
Me = 3420 + 566,17 ∙ (13,5-11) ׃ 5 = 3703,08
Так как, в нашем случае, медиана находится между модой и средней величиной, причем ближе к средней, чем к моде, то распределение близко к нормальному закону.
Итак, исходя из данных таблицы 2, мы можем пронаблюдать последовательность районов по среднемесячной начисленной заработной плате и интенсивность нарастания исследуемого признака, максимальное значение которой (376) наблюдается при значении, равном 3941 рубль.
Анализируя таблицу 3, где представлен интервальный ряд, можно сказать что он содержит 6 групп, каждая из которых содержит от 2 до 11 районов, с удельным весом соответственно от 7,4 %до 40,7 %. Поэтапное нарастание на соответствующие значения по частотам и частостям происходит и в кумулятивном ряду.
2.3 Расчет характеристик рассеяния (вариации) статистического ряда
Следующим этапом изучения вариации признака в совокупности является измерение характеристик силы, величины вариации. Простейшим из них может служить размах или амплитуда вариации – абсолютная разность между максимальным и минимальным значениями признака из имеющихся в изучаемой совокупности значений. Таким образом, размах вариации вычисляется по формуле:
R = xmax - x min= 6251 – 2854 = 3397 рублей
Однако данный показатель не может измерять закономерную силу вариации во всей совокупности, как например среднее линейное отклонение и среднеквадратическое отклонение. Для расчета этих показателей составим таблицу 4.
Таблица 4. - Данные для расчета среднего линейного и среднего квадратического отклонения
Группы по среднемесячной начисленной заработной плате | Сере дина интер вала | Час то ты | Среднее линей ное отклонение | Среднее квадратическое отклонение | ||
|x'i- x| | |x'i- x|fi | (x'i- x)2 | (x'i- x)2∙fi | |||
2854-3420 | 3137 | 11 | 901 | 9915,89 | 812602,09 | 8938622,95 |
3420-3986 | 3703 | 5 | 335 | 1677,22 | 112522,98 | 562614,88 |
3986-4552 | 4269 | 2 | 231 | 461,11 | 53155,86 | 106311,73 |
4552-5118 | 4835 | 4 | 797 | 3186,22 | 634500,75 | 2538003,01 |
5118-5684 | 5401 | 3 | 1363 | 4087,67 | 1856557,64 | 5569672,93 |
5684-6251 | 5967,5 | 2 | 1929 | 3858,11 | 3721255,34 | 7442510,67 |
Итого | 27312,5 | 27 | 23186,22 | 25157736,17 |
Величина среднего линейного отклонения:
L = (∑ |x'i- x|∙fi) ׃ ∑fi = 23186,22 ׃27 = 858,75
Дисперсия:
δ2 = (∑(x'i- x)2∙fi)׃∑fi = 25157736,17׃ 27 = 931768,01
Среднее квадратическое отклонение:
δ = √∑(x'i- x)2∙fi׃∑fi = √(25157736,17׃ 27) = 965,28
В среднем среднемесячная начисленная заработная плата в изучаемой совокупности районов отклонялась от среднемесячной начисленной заработной платы по области на 858,75 рублей. Отношение среднеквадратического отклонения к среднему линейному составит: δ: L = 965,28 : 858,75 = 1,12. Данное соотношение зависит от наличия в совокупностях резких, выделяющихся отклонений и может служить индикатором «засоренности» совокупности неоднородными с основной массой элементами. Для нормального закона распределения оно должно быть равно 1,2, что мы и наблюдаем.
Для оценки интенсивности вариации и для сравнения ее в разных совокупностях и тем более для разных признаков необходимы относительные показатели вариации, одним из которых является коэффициент вариации:
V = δ׃ x∙100 = 965,28∙100 ׃4038,44 =23,90
Так, для совокупности районов вариация среднемесячной начисленной заработной плате может быть оценена как слабая.
2.4 Расчет моментов и характеристик форм распределения
Таблица 5. - Расчет центральных моментов
x'i | fi | x'i-x | (x'i-x) 3 | (x'i-x) 3∙fi | (x'i-x) 4 | (x'i-x) 4∙fi |
2950 | 4 | -1019,37 | -1059244013 | -4236976051 | 1079760392428 | 4319041569712 |
3143 | 4 | -453,37 | -93187874 | -465939367 | 42248482653 | 168993930612 |
3435,5 | 5 | 112,63 | 1428756 | 2857511,35 | 160922339 | 321840444,7 |
4227 | 5 | 678,63 | 312534851 | 1250139402 | 212095872921 | 1060479364605 |
5107,5 | 4 | 1244,63 | 1928059387 | 5784178162 | 2399722697498 | 9598890789992 |
5821,5 | 5 | 1811,13 | 5940850269 | 11881700539 | 10759658749281 | 53798293746405 |
Итого | 27 | x | x | 7030441377 | x | 68946021241772 |
Центральные моменты 3 и 4 порядков: