Рис. 3.5
Рис. 3.5 Результаты регрессионного анализа для всей совокупности регионов.
X1=0,686084*X5
Необходимо проверить значимость уравнения регрессии. Для этого находим наблюдаемое значение статистики F. И получаем, что F=52,470. Так как наблюдаемое значение статистики F превосходит его критическое, то на уровне значимости 0,1 можно утверждать, что полученное уравнение регрессии значимое.
Далее необходимо проверить значимость коэффициентов уравнения. С вероятностью 0,1 можно утверждать, что коэффициент при X5 значим. Коэффициент детерминации составил 47,1%. Следовательно, на долю вариации факторных признаков приходится меньшая часть по сравнению с остальными неучтенными в модели факторами, влияющими на изменение результативного показателя. А значит данная регрессионная модель имеет низкое практическое значение.
Мы провели регрессионный анализ в каждом из кластеров, которые были получены в ходе кластерного анализа. В каждой из групп влияние на доход от услуг связи населению. Далее представлена сводная таблица (табл. 3.9).
Табл.3.9.
Кластеры | Уравнение регрессии | R^2 | Fнабл |
1 | X1=-0,5248-0,3774*X4 | 23,1 % | 4,7929 |
2 | X1=0,1144+0,3002*X4+0,8074*X5 | 58,8 % | 8,5576 |
3 | X1=0,1155-0,4086*X2 | 24,1 % | 5,3965 |
4 | X1=1,7055-0,6151*X2+0,5564*X5 | 79,1 % | 7,5856 |
Табл. 3.9. Сводная таблица регрессионного анализа по кластерам.
Далее рассчитаем коэффициенты эластичности для каждого показатели в каждом кластере. Коэффициент эластичности рассчитывается по следующей формуле:
Коэффициент эластичности показывает влияние каждого из факторов регрессионный модели на зависимый признак.
Ниже представлена сводная таблица, в которой рассчитаны коэффициенты эластичности по каждому из кластеров (табл. 3.10). Расчет коэффициентов эластичности представлен в таблицах расчета коэффициента эластичности по кластерам Приложения 6.
Табл. 3.10
X2 | X3 | X4 | X5 | |
1 | - | - | -0,03916 | - |
2 | - | - |
0,05484
3
-0,05004
-
-
-
4
-0,05971
-
0,004338
-
Percent | G_1:1 | G_2:2 | G_3:3 | G_4:4 | |
cases | Correct | p=,29508 | p=,24590 | p=,31148 | p=,14754 |
G_1:1 | 100,0000 | 18 | 0 | 0 | 0 |
G_2:2 | 100,0000 | 0 | 15 | 0 | 0 |
G_3:3 | 100,0000 | 0 | 0 | 19 | 0 |
G_4:4 | 88,8889 | 0 | 0 | 1 | 8 |
Total | 98,3607 | 18 | 15 | 20 | 8 |
Табл. 4.1. Классификационная матрица.
Как можно заметить из классификационной матрицы почти все объекты были распределены верно по кластерам, но как видно из рис. 4.2. не все объекты попали в в верную группу. Ошибочно распределенные объекты помечены знаком «*».
Рис 4.2.
Рис 4.1. Классификация случаев.
На рисунке классификации случаев (рис 4.2) некорректно отнесённым объектом оказался регион под номером 42. Это Самарская область. Изначально, она была отнесена к самой оснащённой услугами связи группе регионов.
Таким образом, задача получения корректных обучающих выборок состоит в том, чтобы исключить из обучающих выборок те объекты, которые по своим показателям не соответствуют большинству объектов, образующих однородную группу.
Для этого с помощью метрики Махаланобиса определятся расстояние от всех n объектов до центра тяжести каждой группы (вектор средних), определяемых по обучающей выборке. Отнесение экспертом i-го объекта в j-ю группу считается ошибочным, если расстояние Махаланобиса от объекта до центра его группы значительно выше, чем от него до центра других групп, а апостериорная вероятность попадания в свою группу ниже критического значения. В этом случае объект считается некорректно отнесенным и должен быть исключен из выборки.[4]
Процедура исключения объекта из обучающих выборок состоит в том, что в таблице исходных данных (рис 4.1) у объекта, который должен быть исключен из выборки (он помечен "*"), убирается номер принадлежности к этой группе, после чего процесс тестирования повторяется.