Для построения интервального вариационного ряда, характеризующего распределение домохозяйств по объему валового дохода, необходимо вычислить величину и границы интервалов ряда.
При построении ряда с равными интервалами величина интервала h определяется по формуле
,(1)
где – наибольшее и наименьшее значения признака в исследуемой совокупности, k- число групп интервального ряда.
Число групп k задается в условии задания или рассчитывается по формуле Г.Стерджесса
k=1+3,322 lgn, (2)
где n- число единиц совокупности.
Определение величины интервала по формуле (1) при заданных k= 5, xmax= 292,1 тыс. руб., xmin= 22,1 тыс. руб.:
тыс. руб.
При h = 54 тыс. руб. границы интервалов ряда распределения имеют следующий вид (табл. 5):
Таблица 5 | ||
Номер группы | Нижняя граница, тыс. руб. | Верхняя граница, тыс. руб. |
1 | 22,1 | 76,1 |
2 | 76,2 | 130,1 |
3 | 130,2 | 184,1 |
4 | 184,2 | 238,1 |
5 | 238,2 | 292,1 |
Для построения интервального ряда необходимо подсчитать число домохозяйств, входящих в каждую группу (частоты групп). При этом возникает вопрос, в какую группу включать единицы совокупности, у которых значения признака выступают одновременно и верхней, и нижней границами смежных интервалов (для демонстрационного примера – это 76,1; 130,1; 184,1; 238,1 тыс. руб.). Отнесение таких единиц к одной из двух смежных групп рекомендуется осуществлять по принципу полуоткрытого интервала[ ). Т.к. при этом верхние границы интервалов не принадлежат данным интервалам, то соответствующие им единицы совокупности включаются не в данную группу, а в следующую. В последний интервал включаются и нижняя, и верхняя границы.
Процесс группировки единиц совокупности по признаку валовой доход представлен во вспомогательной (разработочной) таблице 6.
Таблица 6 | ||||
Расчетная таблица | ||||
№ группы п/п | Группировка по валовому доходу | Число членов домохозяйства | Валовой доход | Расходы на продукты питания всего |
1 | 2 | 3 | 4 | 5 |
1 | 22,1-76,1 | 1 | 22,10 | 10,20 |
1 | 26,30 | 12,40 | ||
1 | 35,80 | 14,90 | ||
1 | 65,10 | 22,20 | ||
всего | 4 | 149,30 | 59,70 | |
2 | 76,2-130,1 | 2 | 78,00 | 32,20 |
1 | 2 | 3 | 4 | 5 |
2 | 80,00 | 33,20 | ||
2 | 82,00 | 34,20 | ||
2 | 84,00 | 34,80 | ||
3 | 89,70 | 40,20 | ||
2 | 92,4, | 36,80 | ||
3 | 113,60 | 53,10 | ||
всего | 16 | 619,70 | 264,50 | |
3 | 130,2-184,1 | 2 | 134,00 | 46,00 |
2 | 137,60 | 44,40 | ||
4 | 138,00 | 59,20 | ||
3 | 140,10 | 55,80 | ||
3 | 145,50 | 57,90 | ||
2 | 150,00 | 48,60 | ||
6 | 159,00 | 69,60 | ||
3 | 171,00 | 61,50 | ||
3 | 163,50 | 59,70 | ||
2 | 164,20 | 50,40 | ||
3 | 161,40 | 61,50 | ||
всего | 33 | 1664,30 | 614,60 | |
4 | 184,2-238,1 | 4 | 192,00 | 74,40 |
4 | 202,40 | 81,20 | ||
3 | 203,40 | 69,60 | ||
4 | 224,00 | 80,00 | ||
5 | 225,00 | 90,00 | ||
всего | 20 | 1046,80 | 395,20 | |
5 | 238,2-292,1 | 5 | 243,00 | 89,00 |
6 | 280,80 | 110,20 | ||
5 | 292,10 | 105,00 | ||
всего | 16 | 815,90 | 304,20 | |
итого | 89 | 4296 | 1638,2 |
Рисунок 5: Ряд распределения домохозяйств по валовому доходу
На основе групповых итоговых строк «всего» таблицы 6 формируется итоговая таблица 7, представляющая интервальный ряд распределения домохозяйств по объему валового дохода.
Таблица 7 | ||
Распределение домохозяйств по объему валового дохода | ||
Номер группы | Группы домохозяйств по объему валового дохода, тыс. руб., х | Число домохозяйств, f |
1 | 22,1 – 76,1 | 4 |
2 | 76,2 – 130,1 | 16 |
3 | 130,2 – 184,1 | 33 |
4 | 184,2 – 238,1 | 20 |
5 | 238,2 – 292,1 | 16 |
Итого | 89 |
Помимо частот групп в абсолютном выражении в анализе интервальных рядов используются ещё три характеристики ряда, приведенные в графах 4 - 6 таблицы 8. Это частоты групп в относительном выражении, накопленные (кумулятивные) частоты Sj,получаемые путем последовательного суммирования частот всех предшествующих (j-1) интервалов, и накопленные частости, рассчитываемые по формуле
.Таблица 8 | |||||
Структура домохозяйств по валовому доходу | |||||
№ группы | Группы домохозяйств по объему валового дохода, тыс. руб. | Число домохозяйств, fj | Накопленная частота,Sj | Накопленнаячастота, % | |
в абсолютном выражении | в % к итогу | ||||
1 | 2 | 3 | 4 | 5 | 6 |
1 | 22,1 – 76,1 | 4 | 4,49 | 4 | 4,49 |
2 | 76,2 – 130,1 | 16 | 17,97 | 20 | 22,47 |
3 | 130,2 – 184,1 | 33 | 37,06 | 53 | 59,55 |
4 | 184,2 – 238,1 | 20 | 22,51 | 73 | 82,02 |
5 | 238,2 – 292,1 | 16 | 17,97 | 89 | 100,00 |
Итого | 89 | 100,0 |
Вывод. Анализ интервального ряда распределения изучаемой совокупности домохозяйств показывает, что распределение домохозяйств по валовому доходу не является равномерным: преобладают домохозяйства с валовым доходом от 130,2 тыс. руб. до 184,1 тыс. руб. (это 33 домохозяйства, доля которых составляет 37%); 22,5% домохозяйств имеют валовой доход от 184,2 тыс. руб. до 238,1 тыс. руб.
Определим моду и медиану. Мода и медиана являются структурными средними величинами, характеризующими (наряду со средней арифметической) центр распределения единиц совокупности по изучаемому признаку.
Мода Модля дискретного ряда – это значение признака, наиболее часто встречающееся у единиц исследуемой совокупности[1]. В интервальном вариационном ряду модой приближенно считается центральное значение модального интервала (имеющего наибольшую частоту). Более точно моду можно определить графическим методом по гистограмме ряда (рис. 6).
Рисунок 6: Определение моды графическим методом
Конкретное значение моды для интервального ряда рассчитывается по формуле:
(3)где хМo– нижняя граница модального интервала,
h–величина модального интервала,
fMo – частота модального интервала,
fMo-1 – частота интервала, предшествующего модальному,
fMo+1– частота интервала, следующего за модальным.
Согласно таблице 5 модальным интервалом построенного ряда является интервал 130,2 – 184,1 тыс. руб., так как его частота максимальна (f3 = 33).
Расчет моды по формуле (3):
тыс. руб.Вывод. Для рассматриваемой совокупности домохозяйств наиболее распространенный валовой доход характеризуется средней величиной 160,44 тыс. руб.
Медиана Ме – это значение признака, приходящееся на середину ранжированного ряда. По обе стороны от медианы находится одинаковое количество единиц совокупности.
Медиану можно определить графическим методом по кумулятивной кривой (рис. 7). Кумулята строится по накопленным частотам (таблица 8, графа 5).
Рисунок 7: Определение медианы графическим методомКонкретное значение медианы для интервального ряда рассчитывается по формуле:
, (4)где хМе– нижняя граница медианного интервала,
h – величина медианного интервала,
– сумма всех частот,fМе – частота медианного интервала,
SMе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному.
Для расчета медианы необходимо, прежде всего, определить медианный интервал, для чего используются накопленные частоты (или частости) из таблицы 8 (графа 5). Так как медиана делит численность ряда пополам, она будет располагаться в том интервале, где накопленная частота впервые равна полусумме всех частот
или превышает ее (т.е. все предшествующие накопленные частоты меньше этой величины).В задании медианным интервалом является интервал 130,2 – 184,1 тыс. руб., так как именно в этом интервале накопленная частота Sj= 33 впервые превышает величину, равную половине численности единиц совокупности (
= ).Расчет значения медианы по формуле (4):