Таким образом, статистический анализ распределения сводится: к оценке параметров
по случайной выборке.Исследуя те или иные социально-экономические индикаторы для такой огромной страны, как Россия, нельзя опираться только на средние их значения; в зависимости от региона показатели могут значительно отклоняться от средних для страны значений. Это в полной мере относится и к распределению российского населения по среднедушевому доходу. Так, например, среднемесячный доход жителя Москвы или Санкт-Петербурга значительно превышает аналогичный показатель для всей России, а среднемесячный доход жителя Центрально-Черноземного района, напротив, ниже среднероссийского уровня. В этой связи представляет интерес построение сравнение моделей распределений населения по доходу в экономически преуспевающих и отстающих регионах.
В данной работе в качестве преуспевающего региона выступает Архангельская область, а в качестве отстающего – Республика Татарстан. Ниже представлены данные о распределении населения по доходу в изучаемых регионах.
К сожалению, как уже отмечалось ранее, государственная статистика не в состоянии в настоящее время оценить долю лиц со сверхдоходами. Поэтому мы будем ориентироваться на экспертные оценки и косвенные данные.
Этап 1. На базе выборки z1, z2 ..., zn, представляющей первые четыре страты, решается задача расщепления смеси вида:
На "выходе" этого этапа должны быть получены оценки,
Таблица 1 - Распределение населения Архангельской области и Республики Татарстан по размеру среднедушевого денежного дохода в 1995 г
среднедушевой доход | Архангельская обл.,% | Респ. Татарстан, % |
до 100 | 0,1 | 3,3 |
100,1-150 | 1,1 | 8,7 |
150,1-200 | 3,6 | 12 |
200,1-250 | 6,6 | 12,8 |
250,1-300 | 8,9 | 11,8 |
300,1-350 | 10 | 10 |
350,1-400 | 10,2 | 8,2 |
400,1-500 | 9,6 | 6,7 |
500,1-600 | 8,6 | 5,3 |
600,1-700 | 13,7 | 7,6 |
700,1-800 | 15,8 | 7,5 |
800,1-900 | 4,3 | 2 |
900,1-1000 | 2,5 | 1,3 |
более 1000 | 5 | 2,8 |
100 | 100 |
На основе данных табл. 1 население было распределено по четырем доходным группам. Разбиение данных осуществляется методом укрупнения интервалов.
Архангельская область:
Удельный вес первой доходной группы (0-200) = 0,1+1,1+3,6=4,8%
Удельный вес второй доходной группы (200-400)= 6,6+8,9+10+10,2 = 35,7%
Удельный вес третьей доходной группы (400-1000)= 9,6+8,6+13,7+15,8+4,3+2,5 = 54,5%
Удельный вес четвертой доходной группы =5%
Республика Татарстан:
Удельный вес первой доходной группы (0-200) = 3,3+8,7+12=24,00%
Удельный вес второй доходной группы(200-400) = 12,8+11,8+10+8,2 = 42,8%
Удельный вес третьей доходной группы (400-1000)= 6,7+5,3+7,6+7,5+2+1,3 = 30,4%
Удельный вес четвертой доходной группы =2,8%
Таблица 2 - Характеристики доходных групп населения Архангельской области и Республики Татарстан
номер страты (однородной по доходу в группе) | Среднедушевой доход в группе (тыс.руб) | удельный вес доходной группы qj | |
Архангельская область | Респ. Татарстан | ||
1 | до 200 | 0,048 | 0,24 |
2 | 200-400 | 0,357 | 0,428 |
3 | 400-1000 | 0,545 | 0,304 |
4 | более 1000 | 0,05 | 0,028 |
Итого | 1 | 1 |
Этап 2. Определим середины интервалов:
Архангельская обл. | ||||||
0 | 100 | 50 | 0,1 | 0,020833 | 1,041667 | 49,9 |
100,1 | 150 | 125,05 | 1,1 | 0,229167 | 28,65729 | 81,3875 |
150,1 | 200 | 175,05 | 3,6 | 0,75 | 131,2875 | 181,4875 |
4,8 | ||||||
200,1 | 250 | 225,05 | 6,6 | 0,257813 | 58,0207 | 99,9 |
250,1 | 300 | 275,05 | 8,9 | 0,347656 | 95,62285 | 38,20566 |
300,1 | 400 | 350,05 | 10,1 | 0,394531 | 138,1057 | 288,3057 |
25,6 | ||||||
400,1 | 500 | 450,05 | 9,6 | 0,176147 | 79,27486 | 99,9 |
500,1 | 600 | 550,05 | 8,6 | 0,157798 | 86,79688 | 117,5457 |
600,1 | 700 | 650,05 | 13,7 | 0,251376 | 163,4071 | 717,6457 |
700,1 | 800 | 750,05 | 15,8 | 0,289908 | 217,4457 | |
800,1 | 900 | 850,05 | 4,3 | 0,078899 | 67,06817 | |
900,1 | 1000 | 950,05 | 2,5 | 0,045872 | 43,58028 | |
0 | 54,5 | 0 |
Республика Татарстан | ||||||
0 | 100 | 50 | 3,3 | 0,1375 | 6,875 | 49,9 |
100,1 | 150 | 125,05 | 8,7 | 0,3625 | 45,33063 | 37,625 |
150,1 | 200 | 175,05 | 12 | 0,5 | 87,525 | 137,73 |
24 | ||||||
200,1 | 250 | 225,05 | 12,8 | 0,299065 | 67,30467 | 49,9 |
250,1 | 300 | 275,05 | 11,8 | 0,275701 | 75,83154 | 26,04626 |
300,1 | 350 | 325,05 | 10 | 0,233645 | 75,94626 | 276,1463 |
350,1 | 400 | 375,05 | 8,2 | 0,191589 | 71,85537 | |
42,8 | ||||||
400,1 | 500 | 450,05 | 6,7 | 0,220395 | 99,18865 | 99,9 |
500,1 | 600 | 550,05 | 5,3 | 0,174342 | 95,89688 | 85,14523 |
600,1 | 700 | 650,05 | 7,6 | 0,25 | 162,5125 | 685,2452 |
700,1 | 800 | 750,05 | 7,5 | 0,246711 | 185,0452 | |
800,1 | 900 | 850,05 | 2 | 0,065789 | 55,92434 | |
900,1 | 1000 | 950,05 | 1,3 | 0,042763 | 40,62714 | |
30,4 |
Рассмотрим пример расчета для Архангельской области первой страты:
1) выбираем интервалы от 0 до 200 (1 и 2 столбец)
2) рассчитываем среднее значение для каждого интервала (3 столбец)
3) записываем доли населения, принадлежащие данному интервалу (4 столбец), суммируем.
4) Рассчитываем доли. 5 столбец:
0,020833=0,1/4,8
0,229167=1,1/4,8 и т. д. для каждого интервала.
5) Умножаем полученные доли на середины интервалов и получаем 6-й столбец.
6) ищем максимальные значения, полученные в п. 4 и 5.
7) 49,9=200-150,1 (интервал, соответствующий максимальным значениям)
8) 81,3875=131,2875-49,9
9) 181,4875=100,1+81,3875– искомое среднее значение.
Аналогично делаем для всех интервалов.
После определения долей страт "самых богатых" (по данным Федеральной службы государственной статистики) слоев населения производится корректировка долей первых четырех страт по каждому из рассматриваемых регионов:
q5А=1,6%
q5Т=1,8%
Архангельская область:
q1 = 0,048*(1-0,016)=0,047232
q2 = 0,357*(1-0,016)=0,3513
q3 = 0,545*(1-0,016)=0,5363
q4 = 0,05*(1-0,016)=0,0492
q5 =0,016
Респ. Татарстан:
q1 = 0,24*(1-0,018)=0,23568
q2 = 0,428*(1-0,018)=0,4203
q3 = 0,304*(1-0,018)=0,2985
q4 = 0,028*(1-0,018)=0,0275
q5 =0,018
Таблица 3 - Скорректированные значения долей доходных групп в общей численности населения соответствующих регионов
номер страты | Архангельская обл. | Респ. Татарстан | ||||
Среднее значение среднедушевого мес. Дохода в группе (тыс.руб) | удельный вес доходной группы qj | μj | Среднее значение среднедушевого мес. Дохода в группе (тыс.руб) | удельный вес доходной группы qj | μj | |
1 | 181,4875 | 0,0472 | 5,201186781 | 137,73 | 0,23568 | 4,92525894 |
2 | 288,3056641 | 0,3513 | 5,664021251 | 267,504673 | 0,420296 | 5,58913703 |
3 | 717,6456881 | 0,5363 | 6,575975977 | 685,24523 | 0,298528 | 6,52977677 |
4 | 5000 | 0,0492 | 8,517193191 | 5000 | 0,027496 | 8,51719319 |
5 | 50000 | 0,016 | 10,81977828 | 50000 | 0,018 | 10,8197783 |
Этап 3. Кроме имеющейся информации для построения моделей распределений населения регионов по доходу необходимо получить значения параметров σj и σj2. Они будут получены с помощью уравнения регрессии, описывающего зависимость логарифма среднеквадратического отклонения σj от логарифма среднего значения среднедушевого месячного дохода населения, относящегося к j-й страте μj.
Как уже отмечалось выше, в связи с тем, что не представляется возможным проводить столь масштабные социологические исследования, нижеследующие данные были заимствованы у Госкомстата. Но т.к. в данных государственной статистики отсутствуют оценки удельного веса 5-й страты в общей численности населения, доли первых четырех страт пересчитываются с учетом экспертной оценки доли сверхбогатого населения. В качестве исходных данных будут использоваться значения соответствующих показателей за сентябрь 1996г.
Таблица 4 - Характеристики компонентов смеси распределения российских семей по среднедушевому месячному доходу (сентябрь 1996 г.)
Кроме параметра μj в модель был включен параметр j - номер страты. Для построения уравнения регрессии использовался статистический пакет "Statistica 8.0"
Зависимая переменная: σj; логарифм среднего квадратического отклонения среднедушевого дохода в j-й страте.
Независимые переменные:
1. μj ; логарифм среднего значения среднедушевого дохода в страте j.
2. μj2.
3. j ; номер страты.
Рисунок 1 – Коэффициенты регрессии
σj = -1,3638+0,40762 μj – 0,01801 μj^2 -0,11575j
Относительно приведенной модели можно ясно сказать, что все коэффициенты регрессии в ней значимы: на это указывает то, что все они подсвечены красным цветом. Коэффициент детерминации показывает, что вариация логарифма среднеквадратического отклонения на 99,89% определяется вариацией факторных признаков, входящих в модель.