Также в разделе выдвинут ряд предположений о возможной незначимости некоторых факторов и обоснованы причины этого явления. Эти гипотезы предстоит проверить на дальнейших этапах работы.
2. Постановка задачи
В данной курсовой работе рассматривается задача построения аналитической формулы средней стоимости квартиры в зависимости от факторов, влияющих на эту стоимость.
Зависимая переменная: Y - оценка продажной цены квартиры (в тыс.руб).
Независимые переменные: факторы, от которых, предположительно, зависит цена предложения квартиры.
Они разделяются на 2 типа:
1. количественные – имеют единицы измерения;
2. качественные (фиктивные) – имеют значение 0, если квартира не обладает указанным в факторе качеством, и 1, если обладает.
Х 3 = этажей в доме (штук)
Х 4 = номер этажа
Х 5 = жилая площадь (в м2)
Х 6 = остальная площадь (в м2)
Х 16 = количество балконов
Для описания эконометрической модели зависимости продажной цены квартиры от указанных факторов выбрана модель регрессионного уравнения, в частности, модель множественной регрессии.
В качестве параметров модели предполагается использовать весовые коэффициенты при отобранных факторах (в модели весовые коэффициенты обозначены С1,…, С19).
В работе предполагается рассмотреть три типа регрессионных моделей:
1. линейную: Y=C1+C2*X1+C3*X2+…+C20*X19
2. полулогарифмическую:
LOG(Y)=C1+C2*X1+C3*X2+…+C20*X20
3. логарифмическую:
LOG(Y) =C1+C2*X1+C3*X2+C6*LOG(X5)+С(7)*LOG(X6)+…+C20*X19
Т.о. определены набор регрессоров, включаемых в модель, и функциональные формы моделей, далее рассматриваемых в работе.
3. Моделирование.
На этапе моделирования ставится задача построения различных регрессионных моделей продажной цены квартир – линейной, полулогарифмической и логарифмической.
3.1 Линейная модель.
В соответствии с методическими указаниями к выполнению данной курсовой работы за начальную модель примем модель множественной линейной регрессии, включающей все рассматриваемые факторы:
Таблица 3.1 Результаты оценки параметров модели 1.1.
Переменная | Оценка коэффициента | Стандартная ошибка | t-статистика | Значимость |
C | 419.8737 | 158.5591 | 2.648058 | 0.0094 |
X1 | 12.68748 | 34.39027 | 0.368926 | 0.7130 |
X2 | 98.34545 | 41.56345 | 2.366152 | 0.0199 |
X3 | 3.242920 | 9.260882 | 0.350174 | 0.7269 |
X4 | -10.61733 | 8.754530 | -1.212782 | 0.2280 |
X5 | 0.064198 | 2.063977 | 0.031104 | 0.9752 |
X6 | 12.07245 | 3.554034 | 3.396829 | 0.0010 |
X7 | 48.09135 | 52.27926 | 0.919893 | 0.3598 |
X8 | -67.36987 | 63.05200 | -1.068481 | 0.2879 |
X9 | 62.60421 | 36.02753 | 1.737677 | 0.0853 |
X10 | -8.621625 | 80.95371 | -0.106501 | 0.9154 |
X11 | 34.52836 | 88.19550 | 0.391498 | 0.6963 |
X12 | 48.50786 | 85.80417 | 0.565332 | 0.5731 |
X13 | 162.1596 | 76.03639 | 2.132658 | 0.0354 |
X14 | -1.120639 | 120.4957 | -0.009300 | 0.9926 |
X15 | 1587.566 | 173.8360 | 9.132549 | 0.0000 |
X16 | 139.2373 | 46.16360 | 3.016171 | 0.0032 |
X17 | -44.85922 | 51.70357 | -0.867623 | 0.3877 |
X18 | 59.41530 | 48.49251 | 1.225247 | 0.2233 |
X19 | 24.11301 | 43.21481 | 0.557980 | 0.5781 |
R-squared | 0.823775 | F-statistic | 24.84905 | |
Adjusted R-squared | 0.790624 | Prob(F-statistic) | 0.000000 | |
S.E. of regression | 171.9732 |
В скобках под оценками коэффициентов модели приведены их стандартные ошибки.
Выделены те параметры модели, для которых гипотеза о значимости коэффициентов подтвердилась на 5% уровне значимости, т.е. значение Prob.< 0,05 и значения стандартной ошибки меньше оцениваемых коэффициентов в 2 раза и более.
Значимыми оказались факторы:
1. Х2 - удобство положения увеличивает цену на 98.35 тыс. руб.;
2. Х6 - остальная площадь (общая площадь – жилая площадь) увеличивает цену (цена одного квадратного метра: 12.07 тыс. руб.). Т.е. при увеличении остальной площади на 1 кв. метр стоимость квартиры возрастает на 12.07 тыс. руб.
3. Х13 - полнометражная серия квартиры увеличивает цену на 162.16 тыс. руб.;
4. Х15 - элитная серия квартиры увеличивает цену на 1587.57 тыс. руб.;
5. Х16 - наличие каждого балкона увеличивает цену на 139.24 тыс. руб.
Коэффициент детерминации получился равным R-squared=0.82, т.е. весьма близким к единице. Исходя из этого, можно сделать предположение о близости построенного уравнения к выборке.
Значение Prob(F-statistic)=0, следовательно, уравнение в целом абсолютно значимо.
Для выявления эффекта мультиколлинеарности оцениваем матрицу парных коэффициентов корреляции (она приведена в Приложении 2).
Значение коэффициента парной корреляции между факторами X5 и X6 равно 0.41, что может повлечь эффект мультиколлинеарности.
Исходя из экономического смысла, можно объединить эти факторы, просуммировав их (т.к. Х5 - жилая площадь, Х6 – остальная площадь).
Коэффициент парной корреляции между X3 (количество этажей в доме) и X4 (№ этажа) равен 0.48, а между Х3 и X8 (материал стен дома) его значение равно 0.7, что также может обусловить появление мультиколлинеарности.
В связи с этим, введем вместо Х3 и Х4 регрессор (Х3/Х4), которую можно интерпретировать как «соотношение этажности дома и этажа квартиры».
На основании больших значений коэффициентов парной корреляции со многими регрессорами (см. приложение 2), больших стандартных ошибок и больших значений Prob. (> 0.05) исключаем незначимые регрессоры.
Можно предположить, что приведенные ниже факторы незначимы по следующим причинам:
1. Х1 – наличие посредника.
Незначим в связи с невозможностью достоверного определения участия посредника в продаже квартиры.
2. Х7 – наличие телефона;
Х17 – застекленный балкон;
Х18 – железная дверь;
Х19 – домофон.
Незначимость данных факторов подтверждает предположения, выдвинутые в п. 1.2.3 данной работы.
3. Х8 – материал стен дома.
Фактор незначим, так как коррелирует с этажностью дома (пяти-, четырёх- и трёхэтажные дома чаще всего строят из кирпича, а высотные дома – панельные).
4. Х10 – серия: хрущевка;
Х11 – брежневка.
Можно предположить, что факторы незначимы из-за возможной корреляции с величиной площади квартиры. К тому же указанные серии чаще всего имеют старые дома и существенных особенностей, способных сильно влиять на продажную цену квартиры, эти проекты не имеют.
5. Х14 – серия: ленинградский проект.
Фактор незначим, т.к. в выборки присутствует всего несколько квартир, обладающих этим признаком. К тому же, серия не обладает ярко выраженными особенностями, способными существенно повлиять на цену квартиры.
Незначимые факторы из модели удаляются постепенно, т.к. исключив все их одновременно, мы рискуем потерять на самом деле значимые регрессоры, освобожденные от влияния незначимых.
Исходя из внесенных изменений в учитываемые факторы, строится модель 1.2.
Таблица 3.2 Результаты оценки параметров модели 1.2.
Переменная | Оценка коэффициента | Стандартная ошибка | t-статистика | Значимость |
C | 365.4062 | 106.4114 | 3.433899 | 0.0008 |
X2 | 99.52499 | 36.27196 | 2.743855 | 0.0071 |
X3/X4 | 24.29101 | 7.967346 | 3.048821 | 0.0029 |
X5+X6 | 3.910585 | 1.647258 | 2.373996 | 0.0193 |
X12 | 106.7004 | 47.07295 | 2.266704 | 0.0253 |
X13 | 203.1785 | 43.60360 | 4.659674 | 0.0000 |
X15 | 1669.803 | 153.7551 | 10.86015 | 0.0000 |
X16 | 133.6699 | 31.21175 | 4.282679 | 0.0000 |
R-squared | 0.795548 | F-statistic | 62.81391 | |
Adjusted R-squared | 0.782883 | Prob(F-statistic) | 0.000000 | |
S.E. of regression | 175.1235 |
Значимыми оказались все факторы, включенные в регрессию.