Итак: у^ = -13.11 + 1.54 * х3
Рассчитаем коэффицент детерминации:
Можно сказать, что вариация признака Y на 90,3% объясняется вариацией признака X3.
Оценим значимость уравнения регрессии с помощью F - критерия Фишера:
Fтабл = 4,40 (для a = 0,05; k1 = m = 1; k2 = n - m - 1 = 40 - 1 - 1 = 38).
Т.к. F > Fтабл, то с вероятностью 95% данное уравнение регрессии значимо.
Рассчитаем среднюю ошибку аппроксимации:
В среднем расчетные значения y* отличаются от фактических значений y на 27,9 %.
3. Линейная модель: y^ = a + b * x5
Составим таблицу исходных и расчетных данных:
t | y | x5 | x*x | y*x | у * у | (y – yср)2 | (x – xср)2 | y^ | (y - y^)2 | E, % |
1 | 115 | 9 | 81 | 1035 | 13225,0 | 455,8 | 3,8 | 97,3 | 312,2 | 15,4 |
2 | 85 | 5 | 25 | 425 | 7225,0 | 74,8 | 4,2 | 89,8 | 22,9 | 5,6 |
3 | 69 | 6 | 36 | 414 | 4761,0 | 607,6 | 1,1 | 91,7 | 513,9 | 32,9 |
4 | 57 | 1 | 1 | 57 | 3249,0 | 1343,2 | 36,6 | 82,2 | 636,6 | 44,3 |
5 | 184,6 | 1 | 1 | 184,6 | 34077,2 | 8271,9 | 36,6 | 82,2 | 10479,5 | 55,5 |
6 | 56 | 2 | 4 | 112 | 3136,0 | 1417,5 | 25,5 | 84,1 | 790,6 | 50,2 |
7 | 85 | 12 | 144 | 1020 | 7225,0 | 74,8 | 24,5 | 103,0 | 323,8 | 21,2 |
8 | 265 | 10 | 100 | 2650 | 70225,0 | 29360,8 | 8,7 | 99,2 | 27483,5 | 62,6 |
9 | 60,65 | 11 | 121 | 667,15 | 3678,4 | 1089,0 | 15,6 | 101,1 | 1636,7 | 66,7 |
10 | 130 | 6 | 36 | 780 | 16900,0 | 1321,3 | 1,1 | 91,7 | 1469,3 | 29,5 |
11 | 46 | 2 | 4 | 92 | 2116,0 | 2270,5 | 25,5 | 84,1 | 1453,0 | 82,9 |
12 | 115 | 2 | 4 | 230 | 13225,0 | 455,8 | 25,5 | 84,1 | 953,7 | 26,9 |
13 | 70,96 | 5 | 25 | 354,8 | 5035,3 | 514,8 | 4,2 | 89,8 | 354,2 | 26,5 |
14 | 39,5 | 7 | 49 | 276,5 | 1560,3 | 2932,2 | 0,0 | 93,6 | 2922,0 | 136,9 |
15 | 78,9 | 14 | 196 | 1104,6 | 6225,2 | 217,6 | 48,3 | 106,8 | 776,7 | 35,3 |
16 | 60 | 11 | 121 | 660 | 3600,0 | 1132,3 | 15,6 | 101,1 | 1689,7 | 68,5 |
17 | 100 | 1 | 1 | 100 | 10000,0 | 40,3 | 36,6 | 82,2 | 315,8 | 17,8 |
18 | 51 | 6 | 36 | 306 | 2601,0 | 1819,0 | 1,1 | 91,7 | 1653,9 | 79,7 |
19 | 157 | 2 | 4 | 314 | 24649,0 | 4013,2 | 25,5 | 84,1 | 5311,8 | 46,4 |
20 | 123,5 | 12 | 144 | 1482 | 15252,3 | 891,0 | 24,5 | 103,0 | 420,5 | 16,6 |
21 | 55,2 | 9 | 81 | 496,8 | 3047,0 | 1478,4 | 3,8 | 97,3 | 1775,0 | 76,3 |
22 | 95,5 | 6 | 36 | 573 | 9120,3 | 3,4 | 1,1 | 91,7 | 14,7 | 4,0 |
23 | 57,6 | 5 | 25 | 288 | 3317,8 | 1299,6 | 4,2 | 89,8 | 1035,6 | 55,9 |
24 | 64,5 | 10 | 100 | 645 | 4160,3 | 849,7 | 8,7 | 99,2 | 1205,4 | 53,8 |
25 | 92 | 9 | 81 | 828 | 8464,0 | 2,7 | 3,8 | 97,3 | 28,4 | 5,8 |
26 | 100 | 2 | 4 | 200 | 10000,0 | 40,3 | 25,5 | 84,1 | 252,2 | 15,9 |
27 | 81 | 3 | 9 | 243 | 6561,0 | 160,0 | 16,4 | 86,0 | 25,1 | 6,2 |
28 | 65 | 5 | 25 | 325 | 4225,0 | 820,8 | 4,2 | 89,8 | 614,1 | 38,1 |
29 | 110 | 10 | 100 | 1100 | 12100,0 | 267,3 | 8,7 | 99,2 | 116,2 | 9,8 |
30 | 42,1 | 13 | 169 | 547,3 | 1772,4 | 2657,4 | 35,4 | 104,9 | 3941,5 | 149,1 |
31 | 135 | 12 | 144 | 1620 | 18225,0 | 1709,8 | 24,5 | 103,0 | 1024,4 | 23,7 |
32 | 39,6 | 5 | 25 | 198 | 1568,2 | 2921,4 | 4,2 | 89,8 | 2518,1 | 126,7 |
33 | 57 | 8 | 64 | 456 | 3249,0 | 1343,2 | 0,9 | 95,4 | 1477,9 | 67,4 |
34 | 80 | 4 | 16 | 320 | 6400,0 | 186,3 | 9,3 | 87,9 | 62,3 | 9,9 |
35 | 61 | 10 | 100 | 610 | 3721,0 | 1066,0 | 8,7 | 99,2 | 1460,7 | 62,7 |
36 | 69,6 | 4 | 16 | 278,4 | 4844,2 | 578,4 | 9,3 | 87,9 | 334,6 | 26,3 |
37 | 250 | 15 | 225 | 3750 | 62500,0 | 24445,3 | 63,2 | 108,7 | 19978,0 | 56,5 |
38 | 64,5 | 12 | 144 | 774 | 4160,3 | 849,7 | 24,5 | 103,0 | 1481,8 | 59,7 |
39 | 125 | 8 | 64 | 1000 | 15625,0 | 982,8 | 0,9 | 95,4 | 873,6 | 23,6 |
40 | 152,3 | 7 | 49 | 1066,1 | 23195,3 | 3439,8 | 0,0 | 93,6 | 3450,9 | 38,6 |
сумма | 3746 | 282 | 2610 | 27583 | 454221 | 103406 | 75597,5 | 3746 | 101191 | 1831,2 |
ср.зн. | 93,65 | 7,05 | 65,25 | 689,58 | 11355,53 | 2585,16 | 1889,94 | 93,65 | 2529,77 | 45,8 |
Найдем параметры уравнения линейной регрессии:
Итак, у^ = 80,34 + 1,89 * х5.
Расcчитаем коэффициент детерминации:
Можно сказать, что вариация признака Y на 60,7% объясняется вариацией признака X5.
Оценим значимость уравнения регрессии с помощью F-критерия Фишера:
Fтабл = 4,40 (для a = 0,05; k1 = m = 1; k2 = n - m - 1 = 40 - 1 - 1 = 38).
Т.к. F > Fтабл, то с вероятностью 95% данное уравнение регрессии значимо
Рассчитаем среднюю ошибку аппроксимации:
В среднем расчетные значения y* отличаются от фактических значений y на 45,8 %.
Сравним модели:
R | F | Eотн | |
модель 1 | 0,16 | 7,38 | 36,9% |
модель 2 | 0,71 | 95,31 | 27,9% |
модель 3 | 0,02 | 0,83 | 45,8% |
- лучшая модель – модель2
Задание 5. Осуществите прогнозирование для лучшей модели среднего значения показателя У при уровне значимости а = 0.1, если прогнозное значение фактора Х составит 80% от его максимального значения. Представьте графически: фактические и модельные значения, точки прогноза.
Пусть прогнозное значение Х составляет 80% относительно максимального значения (Хmах):
Хпр = Хmax * 80% / 100% = 169.5 * 0,8 = 135.6
Упр = -13,11 + 1,54 * 135,6 = 196,07
Границы доверительного интервала прогноза:
tа = 1,68 (для a = 0,10; k = n - m - 1 = 40 - 1 - 1 = 38).
Интервальный прогноз:
Верхняя граница прогноза Ув = Упр + U = 196,07 + 50,543 = 246,613
145,527 < Упр < 246,613
6. Используя пошаговую множественную регрессию (метод исключения или метод включения), постройте модель формирования цены квартиры за счет значимых факторов. Дайте экономическую интерпретацию коэффициентов модели регрессии.
Построим модель зависимости стоимости кватриры от всех факторов.
Используя функцию "Регрессия" в арсенале M.Excel, рассчитаем характеристики модели автоматически:
см. ПРИЛОЖЕНИЕ 1
Модель имеет вид:
У = 12,606 + (- 34,44) * Х1 + 1,5087 * Х3 + (- 0,506) * Х5
R2 = 0,829, F = 57,99
Fтабл = 3,20 (для a = 0,05; k1 = m = 3; k2 = n - m - 1 = 40 - 3 - 1 = 36)
Т.к. F > Fтабл, то с вероятностью 95% данное уравнение регрессии значимо.
Оценим значимость параметров уравнения регрессии с помощью t - критерия Стьюдента:
tyx1 = | -4,83 |
tyx3 = | 11,62 |
tyx5 = | -0,55 |
> 2,03 → коэф-т корреляции между факторами у и х1 значим
> 2,03 → коэф-т корреляции между факторами у и х3 значим
< 2,03 → коэф-т корреляции между факторами у и х5 незначим
Исключим фактор Х5 как незначимый.
Используя функцию "Регрессия" в арсенале M.Excel, рассчитаем характеристики модели автоматически:
см. ПРИЛОЖЕНИЕ 2
Модель имеет вид:
У = 10,255 + (- 34,56) * Х1 + 1,492 * Х3
R2 = 0,827, F = 88,49
Fтабл = 3,20 (для a = 0,05; k1 = m = 3; k2 = n - m - 1 = 40 - 2 - 1 = 37)
Т.к. F > Fтабл, то с вероятностью 95% данное уравнение регрессии значимо
Оценим значимость параметров уравнения регрессии с помощью t - критерия Стьюдента:
tyx1 = | -4,90 |
tyx3 = | 11,92 |
> 2,03 → коэф-т корреляции между факторами у и х1 значим
> 2,03 → коэф-т корреляции между факторами у и х3 значим
Т.к. все параметры значимы, то мы получили модель формирования цены квартиры за счет значимых факторов.
Задание 7. Оцените качество построенной модели. Улучшилось ли качество модели по сравнению с однофакторной моделью? Дайте оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, β- и ∆-коэффициентов.
Итак, для анализа используем модель:
У =10,255 + (- 34,44) * Х1 + 1,4921 * Х3
Значение "b1" = - 34,44 означает, что с ростом фактора Х1 на 1 единицу (смена города), цена квартиры снизится на -34,44 тыс.долл.
Значение "b2" = 1,49 означает, что с ростом фактора Х3 на 1 единицу (1 кв.м.), цена квартиры вырастет на 1,49 тыс. долл.
R2 = 0,827 - это значение выше, чем значение R2 однофакторной модели
F =88,49
Fтабл = 3,20 (для a = 0,05; k1 = m = 3; k2 = n - m - 1 = 40 - 2 - 1 = 37).
Т.к. F > Fтабл, то с вероятностью 95% данное уравнение регрессии значимо.