Рис.6. Корреляционное поле
При его рассмотрении можно сказать, что наиболее подходящей будет степенная модель, т.к. она визуально отражает зависимость
от фактора . Также мы можем это увидеть из данных приведенных в табл. 12.Табл. 12. Значения критериев отбора модели
Тип модели | R^2 | Ā | MAD | Sост |
линейная | 0,18 | 145,89% | 53,91433 | 6143,55 |
квадратичная | 0,38 | 74,27% | 40,744138 | 5361,10 |
гипербол(обратная) | 0,09 | 157,15% | 62,058889 | 6479,29 |
степенная | 0,59 | 53,26% | 41,088475 | 0,64 |
показательная | 0,24 | 7,47% | 0,0075565 | 0,87 |
логарифмическая | 0,28 | 99,97% | 101,84785 | 5741,17 |
Уравнение данной модели выглядит следующим образом:
.По критерию Фишера модель является значимой, т.к.
, где и .Оценим тесноту связи с помощью коэффициента детерминации, который равен
. Это значит, что 59% вариации уровня разводов объясняется вариацией уровня прожиточного минимума. Остальные 41% вариации объясняются неучтенными в данной модели факторами.Значит, математическая модель, выражающая данную зависимость объясняющей переменной, подходит для описания зависимой переменной. Включение этого фактора в модель множественной регрессии целесообразно.
В качестве факторов, оказывающих влияние на уровень доходов, после предварительного исследования, были отобраны следующие факторы:
- психические расстройства (чел.); - алкоголизм (чел.); - наркомания (чел.); - инвалидность (тыс. чел.).Рассчитанные парные коэффициенты корреляции представим в виде корреляционной матрицы (табл. 13).
Табл. 13. Корреляционная матрица
1 | 0,76 | 0,91 | 0,79 | 0,42 | |
0,76 | 1 | 0,75 | 0,73 | 0,47 | |
0,91 | 0,75 | 1 | 0,76 | 0,39 | |
0,79 | 0,73 | 0,76 | 1 | 0,36 | |
0,42 | 0,47 | 0,39 | 0,36 | 1 |
Из анализируемых факторов наибольшее влияние на уровень разводов оказывают все факторы, кроме шестого – инвалидность, т.к. значение линейных коэффициентов корреляции выше 0,7.
Построим модель множественной линейной регрессии:
Коэффициент детерминации
, т.е. 85,7% вариации уровня разводов объясняется вариацией четырех рассмотренных факторов.Скорректированный коэффициент детерминации
.Данная модель является значимой по критерию Фишера, т.к.
, где и .Также проверим коэффициенты линейной регрессии на значимость:
, а , , , , . Таким образом, , , , , ,значит, коэффициенты
и значимы.Теперь мы получили новую модель, которая выглядит следующим образом:
.Оценим точность прогноза, для этого рассчитаем среднюю ошибку аппроксимации:
По данной модели средняя ошибка аппроксимации, хотя и превышает рекомендуемое значение 8-10%, но не намного, следовательно, приближение построенной модели к наблюдаемым статистическим значениям считается хорошим. Точность прогноза найдена с помощью критерия
.Произведем сравнение построенных моделей множественной и парной регрессии зависимости уровня разводов от алкоголизма. Сравнение производится, чтобы сделать выбор между двумя моделями (табл. 13).