Иерархическая кластеризация. После изучения полученного результата описательной статистики показателей социально-экономического положения было установлено, что ряд переменных не стоят нашего внимания, а именно – коэффициент Джини.
Было решено провести серию пробных разбиений наблюдений на 2, 3 и так далее кластеров, чтобы установить переменные либо данные, которые играют малозаметную роль в разбиении регионов на кластеры. При этом воспользуемся методом k-средних.
При первом же разбиении на 2 кластера, мы можем судить о том, что город Москва явно превзошел все остальные регионы по уровню социально-экономического развития. И при любом количестве кластеров Москва всегда будет отделяться в отдельный кластер. Поэтому целесообразнее всего будет исключить Москву из рассмотрения в работе, ибо дальнейшее ее рассмотрение не поможет нам объективно взглянуть на общую социально-экономическую обстановку в целом по России. То есть далее мы будем рассматривать только 69 регионов.
Кластерный анализ с разбиением на 3 кластера создал у нас две достаточно большие группы: 24 и 38 регионов и одну маленькую (7 регионов). В самую малочисленную группу попали самые худшие по показателям регионы с достаточно малыми доходами, зарплатами и большой прослойкой населения, доходы которых явно меньше прожиточного минимума. Такие регионы как Ингушетия, Калмыкия, республика Тыва. В основном это регионы с крайне низким уровнем жизни и не развитой экономикой.
Две другие группы оказались более подкованными в этом плане. Во вторую группу попали такие регионы как Тамбовская, Тульская области республика Саха. Лучший результат же показали регионы первого кластера. Самые доходные и социально обеспеченные. Такие как Московская область, Мурманская и Вологодская области.
Далее приводится дендрограмма (график объединения) для иерархического кластерного анализа с оставшимися переменными. Из нее будет видно на каких расстояниях объекты объединяются в кластеры, из этого можно будет сделать вывод на сколько кластеров разбить всю совокупность.
Красной линией на дендрограмме мы отметили один из вариантов кластерного решения, который предусматривает разбиение на 6 кластеров. Это решение даёт следующие центры кластеров:
Таблица 6 «Кластерные центры по итогам иерархического анализа»
Кластер | 1 | 2 | 3 | 4 | 5 | 6 |
zFond | ,18 | -,32 | -,15 | -,03 | 1,06 | -,70 |
zSdohod | ,58 | -,25 | -,89 | ,01 | 1,37 | -1,73 |
zSzarplata | 1,18 | -,35 | -1,23 | ,68 | 1,14 | -1,29 |
zSpensii. | ,86 | ,36 | -,53 | -1,83 | -,55 | -1,41 |
zChislMin | -,80 | -,07 | 1,54 | -,21 | -,99 | 4,60 |
Кластеризация методом k-средних. Повторим разбиение на 6 групп с помощью метода k-средних. Таблица 7 показывает, как распределились в итоге регионы по кластерам. Последняя графа показывает расстояние от региона до центра его кластера, то есть, как бы говорит, далеко ли регион находится от типичного для данного кластера региона.
Таблица 7 «Принадлежность к кластерам»
Кластер | Регион | Расстояние |
1 | Белгородская область | ,986 |
Московская область | 1,071 | |
Липецкая область | ,968 | |
Ярославская область | ,404 | |
Вологодская область | ,633 | |
Республика Башкортостан | ,933 | |
Ростовская область | 1,217 | |
Волгоградская область | 1,092 | |
Астраханская область | ,862 | |
Республика Татарстан | 1,185 | |
Челябинская область | ,745 | |
Кемеровская область | ,841 | |
Омская область | ,834 | |
Томская область | 1,230 | |
Магаданская область | 1,251 | |
2 | Брянская область | ,756 |
Владимирская область | 1,281 | |
Воронежская область | 1,03 | |
Калужская область | ,837 | |
Костромская область | ,529 | |
Орловская область | 1,390 | |
Рязанская область | ,588 | |
Смоленская область | ,579 | |
Тамбовская область | 1,312 | |
Тверская область | 1,190 | |
Тульская область | 1,054 | |
Республика Карелия | 1,161 | |
Ленинградская область | 1,937 | |
Калининградская область | 1,439 | |
Новгородская область | ,633 | |
Псковская область | 1,124 | |
Кабардино-Балкарская Республика | ,793 | |
Карачаево-Черкесская Республика | 1,135 | |
Республика Северная Осетия-Алания | 1,696 | |
Краснодарский край | 1,478 | |
Ставропольский край | 1,052 | |
Удмуртская Республика | ,934 | |
Чувашская Республика | ,867 | |
Кировская область | 1,027 | |
Нижегородская область | ,672 | |
Оренбургская область | ,608 | |
Пензенская область | ,972 | |
Саратовская область | ,931 | |
Республика Хакасия | 1,135 | |
Алтайский край | 1,647 | |
Новосибирская область | 1,273 | |
3 | Ивановская область | 1,734 |
Республика Калмыкия | 1,684 | |
Республика Адыгея | ,908 | |
Республика Дагестан | 1,051 | |
Республика Мордовия | 1,155 | |
Республика Марий Эл | 1,317 | |
Ульяновская область | ,843 | |
Курганская область | 1,007 | |
Республика Алтай | 1,197 | |
Республика Бурятия | 2,107 | |
Республика Тыва | 1,163 | |
4 | Курская область | 1,489 |
Мурманская область | 1,090 | |
Республика Саха | 1,124 | |
Приморский край | 1,385 | |
Хабаровский край | ,563 | |
Амурская область | ,764 | |
Сахалинская область | 1,198 | |
5 | Санкт-Петербург | ,794 |
Свердловская область | ,897 | |
Республика Коми | ,873 | |
Самарская область | 1,381 | |
6 | Республика Ингушетия | ,000 |
Чем меньше показатель расстояния у данного кластера тем он более ярко выраженный представитель этого кластера.
Таблица 8. «Количество регионов, попавших в каждый из кластеров»
кластер | 1 | 15,000 |
2 | 31,000 | |
3 | 11,000 | |
4 | 7,000 | |
5 | 4,000 | |
6 | 1,000 | |
верно | 69,000 | |
пропущено | ,000 |
По результатам кластеризации мы получили один крупный кластер (2) , два средних кластера (1), (3), два маленьких кластера (4),(5) и один очень маленький полученный из одного региона РФ (6).
Для получения более ясного представления о кластерах, стоит упомянуть ярких представителей своих групп. В первый кластер попали такие регионы как: Московская область, Омская область, Ярославская область. Во второй попали регионы такие как: Костромская область, Нижегородская и Смоленская области. У третьего кластера яркими представителями оказались Ульяновская область и Адыгея. У четвертого кластера выделились Хабаровский край, Амурская область. А яркими представителями пятого кластера стали Санкт-Петербург, Свердловская область. А вот шестой кластер состоит лишь из одного региона России- Республики Ингушетии.
Для создания качественного представления о социально-экономическом положении (различиях в имущественном обеспечении и неравенстве в доходах) очень полезно будет рассмотреть таблицу окончательных кластерных центров.
Таблица 9 «Окончательные кластерные центры»
кластер | ||||||
1 | 2 | 3 | 4 | 5 | 6 | |
zFond | ,15515 | -,34257 | -,21524 | -,02923 | 1,06128 | -,70377 |
zSdohod | ,53023 | -,26863 | -,86786 | ,01469 | 1,37473 | -1,72943 |
zSzarplata | 1,01466 | -,36758 | -1,20269 | ,67806 | 1,14142 | -1,28902 |
zSpensii | ,72391 | ,40307 | -,44828 | -1,83259 | -,54984 | -1,40592 |
zChislMin | -,76469 | -,05674 | 1,37576 | -,21190 | -,99077 | 4,59510 |
В данной таблице отображены окончательные кластерные центры. Координаты кластерного центра – это средние значения по каждой переменной кластеризации по всем регионам, входящим в этот кластер. Учитывая, что переменные стандартизированы, средние значения даны здесь в стандартизированном виде. То есть, 0 означает средний уровень по России, положительное значение – выше среднероссийского уровня, отрицательное – ниже. Таким образом, кластерные центры показывают, чем характеризуется каждый кластер, по каким переменным есть отличия. В данном случае они характеризуют материальное расслоение общества.
Первый кластер. Регионы попавшие в данный кластер это по большей части довольно стабильные и высокоразвитые в плане промышленности и социального обеспечения. Достаточно крепкие середняки если можно так сказать. Населения живущее ниже прожиточного минимума не много, небольшое расслоение общества соответствует неплохой социальной подкованности регионов. Уверенные показатели доходов, пенсий и заработной платы говорят о благополучии данных регионов.
Кластер №2 - самый многочисленный кластер. В него входит основная часть регионов России. Надо сказать достаточно посредственные, ничем особо не выделяющиеся, регионы с довольно сносными показателями. И хотя показатели по большей части не плохи смотрятся они явно хуже чем регионы первого кластера. Небольшое расслоение общества, показатели доходов и заработной платы находятся в отрицательном соотношении с прожиточным минимумом. Приятно удивляет показатель по пенсиям. В общем если данные регионы и можно отнести к середнякам то уж точно к их худшей части.