Незначимыми оказались те же, факторы, что и в модели 1.1. В разделе 3.1 приводится обоснование возможных причин их незначимости.
Постепенно удаляя из модели незначимые факторы, переходим к скорректированной полулогарифмической модели 3.2.
Таблица 3.6 Результаты оценки параметров модели 3.2.
Переменная | Оценка коэффициента | Стандартная ошибка | t-статистика | Значимость |
C | 4.344850 | 0.391207 | 11.10627 | 0.0000 |
X2 | 0.091543 | 0.026524 | 3.451323 | 0.0008 |
LOG(X3/X4) | 0.044884 | 0.018737 | 2.395527 | 0.0183 |
LOG(X5+X6) | 0.532116 | 0.096268 | 5.527467 | 0.0000 |
X9 | 0.064231 | 0.025013 | 2.567882 | 0.0115 |
X12 | 0.104642 | 0.034641 | 3.020798 | 0.0031 |
X13 | 0.140065 | 0.032859 | 4.262618 | 0.0000 |
X15 | 0.727334 | 0.102035 | 7.128315 | 0.0000 |
X16 | 0.082189 | 0.023461 | 3.503266 | 0.0007 |
R-squared | 0.778594 | F-statistic | 49.23217 | |
Adjusted R-squared | 0.762779 | Prob(F-statistic) | 0.000000 | |
S.E. of regression | 0.126934 |
.
Коэффициент детерминации получился равным R-squared=0.78, т.е. весьма близким к единице, что, возможно, говорить о близости построенного уравнения к выборке. Скорректированный коэффициент детерминации имеет значение Adjusted R-squared=0.76, что также может говорить о корректности предыдущего утверждения.
Значение Prob(F-statistic)=0, следовательно, уравнение в целом абсолютно значимо. Коэффициенты при всех учтенных в данной модели факторах значимы.
Т.о. на этапе моделирования построено 3 различные значимые модели (линейная, полулогарифмическая, логарифмическая), оценивающие зависимость цены предложения трёхкомнатной квартиры на рынке вторичного жилья Металлургического района от различных факторов.
4. Идентификация и интерпретация полученных моделей.
На этапе идентификации модели проводится её тестирование и коррекция на гетероскедастичность, после чего каждая из трёх полученных моделей интерпретируется.
4.1 Суть гетероскедастичности.
Для нахождения оценок линейных регрессионных зависимостей применяется метод наименьших квадратов (МНК).
Однако, МНК требует выполнения условий Гаусса-Маркова, которые гарантируют состоятельность, несмещенность и эффективность найденных оценок [1, с.23]. Нарушение этих условий может давать оценки с плохими статистическими свойствами. Одной из ключевых предпосылок МНК является условие постоянства дисперсии случайных отклонений. Выполнимость данной предпосылки называется гомоскедастичностью (постоянством дисперсии отклонений). Её невыполнимость называется гетероскедастичностью (непостоянством дисперсии отклонений) [3, с.230].
Т.о. при гетероскедастичности оценки коэффициентов получаются неэффективными. Вследствие вышесказанного все выводы, получаемые на основе соответствующих t- и F-статистик, будут ненадежными. Следовательно, статистические выводы, получаемые при стандартных проверках качества оценок, могут быть ошибочными приводить к неверным заключениям по построенной модели. Вполне вероятно, что стандартные ошибки коэффициентов будут занижены. Это может привести к признанию статистически значимыми коэффициентов, таковыми на самом деле не являющимися [3, с.232].
4.2 Проверка и коррекция на гетероскедастичность.
Проверка на гетероскедастичность построенных моделей осуществляется в пакете EViews-3 с помощью теста Уайта. В нашем случае его результаты говорят о том, что гипотеза о гомоскедастичности не подтвердилась для любой из трёх моделей.
Проведем коррекцию на гетероскедастичность для каждой из них.
Сделать поправку на гетероскедастичность и «улучшить» оценку матрицы ковариаций позволяет метод расчета стандартных ошибок по форме Уайта, автоматически реализуемый в EViews-3. Результаты коррекции линейной, полулогарифмической и логарифмической моделей на гетероскедастичность приведены ниже.
4.2.1. Коррекция на гетероскедастичность модели 1.2.
Таблица 4.1 Скорректированная на гетероскедастичность модель 1.2.
Переменная | Оценка коэффициента | Стандартная ошибка | t-статистика | Значимость |
C | 365.4062 | 179.1846 | 2.039272 | 0.0438 |
X2 | 99.52499 | 30.38976 | 3.274951 | 0.0014 |
X3/X4 | 24.29101 | 10.83755 | 2.241376 | 0.0270 |
X5+X6 | 3.910585 | 3.634448 | 1.075978 | 0.2842 |
X12 | 106.7004 | 38.78448 | 2.751111 | 0.0069 |
X13 | 203.1785 | 58.28511 | 3.485943 | 0.0007 |
X15 | 1669.803 | 355.8772 | 4.692077 | 0.0000 |
X16 | 133.6699 | 50.29383 | 2.657779 | 0.0090 |
R-squared | 0.795548 | F-statistic | 62.81391 | |
Adjusted R-squared | 0.782883 | Prob(F-statistic) | 0.000000 | |
S.E. of regression | 175.1235 |
Малая значимость регрессора Х5+Х6 (Prob.=0.28), обозначающего общую площадь квартиры, вероятнее всего обусловлена связью между метражом квартиры и её серией.
Такие квартирные серии, как 121 (Х12), полнометражная (Х13), элитная (Х15), обладая рядом особенностей, изначально несут в себе информацию о стоимости квартиры.
Целесообразно ввести новый регрессор Х20:
Включение регрессора Х20 в модель позволит освободить переменные, описывающие принадлежность квартиры к указанным сериям, от влияния фактора метражности. Возможно, это улучшит качество оценок параметров модели и увеличит их значимость. Коррекция на гетероскедастичность новой модели 1.3 дает следующие результаты.
Таблица 4.2 Результат коррекции на гетероскедастичность модели 1.3.
Переменная | Оценка коэффициента | Стандартная ошибка | t-статистика | Значимость |
C | 322.7641 | 118.5302 | 2.723054 | 0.0075 |
X2 | 102.2354 | 31.48546 | 3.247067 | 0.0015 |
X3/X4 | 23.57107 | 10.12205 | 2.328684 | 0.0217 |
(X5+X6)*X20 | 4.377593 | 2.121505 | 2.063438 | 0.0414 |
X12 | 417.4320 | 132.7759 | 3.143885 | 0.0021 |
X13 | 528.8244 | 129.8443 | 4.072757 | 0.0001 |
X15 | 2211.755 | 417.3258 | 5.299828 | 0.0000 |
X16 | 152.1110 | 36.70453 | 4.144202 | 0.0001 |
R-squared | 0.788406 | F-statistic | 60.14874 | |
Adjusted R-squared | 0.775298 | Prob(F-statistic) | 0.000000 | |
S.E. of regression | 178.1561 |
Полученная модель имеет вид:
Yt=322.76+102.24*X2t+23.57*X3t/X4t+4.38*(X5t+X6t)*Х20+417.43*X12t+
(118.53) (31.49) (10.12) (2.12) (132.78)
+528.82*X13t+2211.76*X15t+152.11*X16t, t=1…121
(129.84) (417.33) (36.70)
Значение коэффициента детерминации получилось равным R-squared=0.79, из чего может следовать близость построенного уравнения к выборке. Скорректированный коэффициент детерминации имеет значение
Adjusted R-squared=0.78, т.е. он отличается от R-squared незначительно, что также говорит в пользу предыдущего утверждения.
Значение Prob(F-statistic)=0, следовательно, уравнение в целом абсолютно значимо.
Рассмотрим экономический смысл значимых регрессоров и их влияние на цену предложения квартиры.
1. Х2 - удобство положения увеличивает цену на 102.24 тыс. руб.