С целью исключения коррелирующих между собой факторов рассмотрим корреляционную матрицу (Приложение 3).
В результате последовательного исключения незначимых переменных получили следующие результаты оценивания:
Рис. 5.3.2. Результаты вычисления после исключения незначимых переменных
LOG(PRICE) = 11.2020286 - 0.1137005911*COLOUR_WRITE + 0.1167036723*ELECTRONNOE - 0.066814893*CLASS_A + 0.1480422557*SOXL + 0.106879945*RAZMOR_MK + 0.3319897268*LOG(VHK) - 0.70497857*LOG(DEPTH) - 0.2756174193*INDESIT - 0.1192342258*BOSCH - 0.1209517658*WHIRLPOOL
Модель в целом осталась значима; доля общей вариации результирующего признака уменьшилась на 0,0073 и составила 0,6774.
Для исследования полученной модели на наличие гомоскедастичности используется тест Уайта:
Рис. 5.3.3. Результаты теста Уайта
На 5% уровне значимости, гипотеза о гомоскедастичности принимается.
Проводим RESET-тест на ошибку спецификации регрессоров:
Рис. 5.3.4. Результаты RESET-теста
Результат RESET-теста свидетельствует об отсутствии ошибки спецификации.
5.4 Выбор наилучшей модели
В процессе моделирования получено две значимых модели, качественно описывающих процесс формирования на рынке г. Челябинска продажной стоимости двухкамерных холодильников.
Так как линейная модель имеет ошибочную спецификацию, то сразу перейдем к рассмотрению логарифмической и полулогарифмической модели.
Для сравнения логарифмической и полулогарифмической модели воспользуемся J-тестом, для этого составим прогноз цены для логарифмической модели (LPRICEF) и прогноз цены для полулогарифмической модели (PRICEFL). Затем построим следующие регрессии:
Для полулогарифмической:
LOG(PRICE) = C(1) + C(2)*COLOUR_WRITE + C(3)*ELECTRONNOE + C(4)*CLASS_A + C(5)*SOXL + C(6)*RAZMOR_MK + C(7)*VHK + C(8)*DEPTH + C(9)*INDESIT + C(10)*BOSCH + C(11)*WHIRLPOOL + C(12)*LPRICEF
Длялогарифмической:
LOG(PRICE) = C(1) + C(2)*COLOUR_WRITE + C(3)*ELECTRONNOE + C(4)*CLASS_A + C(5)*SOXL + C(6)*RAZMOR_MK + C(7)*LOG(VHK) + C(8)*LOG(DEPTH) + C(9)*INDESIT + C(10)*BOSCH + C(11)*WHIRLPOOL + C(12)*PRICEFL
При проведении сравнения между полулогарифмической и логарифмической моделями посредством применения J-теста получены следующие результаты:
Для полулогарифмической модели:
Рис. 5.4.1 Результаты J-теста для полулогарифмической модели
Для логарифмической модели:
Рис. 5.4.1 Результаты J-теста для логарифмической модели
Получаем, что при 5-и процентном уровне значимости нулевая гипотеза полулогарифмической регрессии принимается, поскольку коэффициент при LCENAF =3,54Е-05 и Probability равна 0,2373, то есть этот коэффициент в полулогарифмической модели незначим. В логарифмической модели нулевая гипотеза также принимается, так как коэффициент при CENAFL =2.63E-05 и Probability равна 0,3361. Следовательно, обе модели принимаются.
Для выбора лучшей модели проверим логарифмическую и полулогарифмическую модели на соответствие теоретической цены реальной. Для полулогарифмической модели точность прогноза для контрольной выборки составляет 89,01%, а для логарифмической 88,41%. Получаем, что полулогарифмическая модель более точна. Поэтому выберем ее как итоговую модель.
6. Проверка качества модели
Рассмотрим полученную итоговую модель:
LOG(PRICE)= 10.4865 -0.1133*COLOUR_WRITE +0.1166*ELECTRONNOE -
(0,225) (0,029) (0,035)
0.0673*CLASS_A + 0.1475*SOXL + 0.1076*RAZMOR_MK + 0.0015*VHK -
(0,032) (0,034) (0,031) (0,0005)
0.0117*DEPTH -0.2759*INDESIT -0.1186*BOSCH -0.1224*WHIRLPOOL
(0,004) (0,056) (0,036) (0.042)
Для определения значимости коэффициентов регрессии необходимо определить фактическое и критическое значение t-критерия Стьюдента при определённом уровне значимости, если | t | > tкр, то гипотеза о незначимости коэффициента отвергается. Фактическое значение t-статистики рассчитывается, как частное оценки коэффициента и стандартной ошибки оценки.
В нашем случае, на этапе устранения мультиколлинеарности из всех трех моделей были исключены незначимые переменные, после чего были построены модели, содержащие исключительно значимые переменные.
Коэффициент R-squared = 0.676468 говорит нам о хорошем качестве подгонки регрессионной модели к значениям выборки. AdjustedR- squared = 0.648816 также утверждает о соответствии модели.
Проверим близость реальных данных модельным, полученным по контрольной части выборки:
Таблица 6.3.
Близость прогнозирования
№ п/п | Наблюдаемая цена | Прогноз | Отклонение прогноза | Ошибка прогноза (%) |
1 | 16750 | 17894,55 | 1145 | 6,83% |
2 | 19790 | 20314,06 | 524 | 2,65% |
3 | 17550 | 15590,47 | -1960 | 11,17% |
4 | 23330 | 25906,46 | 2576 | 11,04% |
5 | 25600 | 21008,44 | -4592 | 17,94% |
6 | 20462 | 20410,32 | -52 | 0,25% |
7 | 15450 | 17447,8 | 1998 | 12,93% |
8 | 17750 | 25580,35 | 7830 | 44,11% |
9 | 34450 | 30624,34 | -3826 | 11,10% |
10 | 30500 | 30732,64 | 233 | 0,76% |
11 | 23550 | 25734,23 | 2184 | 9,27% |
12 | 34800 | 30710,11 | -4090 | 11,75% |
13 | 27700 | 22194,84 | -5505 | 19,87% |
14 | 29873 | 29950,12 | 77 | 0,26% |
15 | 24125 | 23448,77 | -676 | 2,80% |
16 | 19490 | 25047,39 | 5557 | 28,51% |
17 | 25930 | 23310,13 | -2620 | 10,10% |
18 | 32659 | 31647,86 | -1011 | 3,10% |
19 | 31400 | 27664,99 | -3735 | 11,89% |
20 | 20990 | 19548,72 | -1441 | 6,87% |
21 | 16240 | 19729,58 | 3490 | 21,49% |
22 | 31790 | 29306,57 | -2483 | 7,81% |
23 | 26903 | 24947,07 | -1956 | 7,27% |
24 | 26719 | 29269,39 | 2550 | 9,55% |
25 | 19019 | 21443,2 | 2424 | 12,75% |
26 | 32289 | 27521,83 | -4767 | 14,76% |
27 | 17570 | 18276,61 | 707 | 4,02% |
28 | 26296 | 24152,68 | -2143 | 8,15% |
29 | 20580 | 17714,09 | -2866 | 13,93% |
30 | 30391 | 29606,94 | -784 | 2,58% |
31 | 22219 | 24499,65 | 2281 | 10,26% |
32 | 25074 | 29075,69 | 4002 | 15,96% |
Среднее значение | 24601 | 24384,68 | -217 | 10,99% |
Таблица показывает, что наша модель дает достаточно адекватный прогноз, то есть выбранная модель вполне пригодна для прогнозирования в пределах исследуемой предметной области.
Рис. 6.3.1 Сопоставление реальных и модельных данных.
Для рабочей выборки точность прогноза составляет 88,73%, а для контрольной – 89,01%. Следовательно, уравнение полулогарифмической модели пригодно для прогнозирования в пределах исследуемой предметной области, то есть выбранная модель является решением задачи поставленной курсовой работой.
7. Интерпретация модели
Раскроем экономическую сущность полученной множественной линейной регрессии:
Итоговыйвидмодели:
LOG(PRICE) = 10.4865464 - 0.1132719331*COLOUR_WRITE + 0.1166536381*ELECTRONNOE - 0.0672971414*CLASS_A + 0.1474838763*SOXL + 0.1075644245*RAZMOR_MK + 0.001463502726*VHK - 0.0117092567*DEPTH - 0.2759079383*INDESIT - 0.1186543974*BOSCH - 0.122385393*WHIRLPOOL
Выявим также причины полученных особенностей модели.
1. Коэффициент 10,49 (постоянный коэффициент) не имеет простого толкования. Он помогает прогнозировать значения цены при заданных значениях холодильников.
2. Предназначенность холодильников к белому цвету уменьшает цену на 11,33%. Цветные холодильники пользуются большим спросом, так как люди выбирая дизайн кухни, подбирают холодильник с сочетанием цвета мебели. А белые холодильники пользуются меньшим спросом, поэтому цена на них падает.
3. Электронное управление создает дополнительные удобства в управлении агрегатом. Оно подразумевает наличие у холодильника электронной панели управления с цифровым дисплеем. Такое управление позволяет точно поддерживать температуру, оптимальную для хранения различных продуктов, а также экономит электроэнергию, вследствие этого цена на холодильник увеличивается на 11,66%.
4. Холодильники с энергопотребление класса А меньше пользуются спросом, чем холодильники класса А+, цена на них падает на 6,73%, потому что люди стараются сэкономить на электроэнергии, так как она дорожает. Поэтому предпочтение отдают холодильникам, которые потребляют меньше электроэнергии.
5. Суперохлождение является дополнительной опцией, она ведет к увеличению затрат. За счет этого цена на холодильник увеличивается на 14,75%. (Подозрительно большой вклад в формирование цены оказывает этот фактор)
6. Применение системы NoFrost при размораживании морозильной камеры очень удобна тем, что она не требует дополнительного времени на уборку в холодильнике, так как модели оснащенные такой системой не нуждаются в размораживании. Поэтому цены на такие холодильники увеличиваются на 10,76%.
7. Увеличение объема холодильной камеры увеличивает цену на 0,15%. Современные люди предпочитают в условиях нехватки времени пользоваться полуфабрикатами, которые необходимо хранить в холодильной камере. Так же они выбирают объем холодильника по своим потребностям в зависимости от количества людей в семье. Поэтому холодильники с большим объемом пользуются большим спросом и за счет этого цена на них выше.
8. Холодильники, у которых увеличена глубина, занимают много места, а также они не удобны в использовании тем, что приходится класть продукты в несколько рядов(4-5). Поэтому уменьшает стоимость холодильника на 1,17%.
9. Принадлежность холодильников к фирме Indesit уменьшает их стоимость на 27,59%, Bosch на 11,86% и Whirlpool на 12,24% по сравнению с фирмой Gorenj. Холодильники фирмы Gorenj на данный момент является лидером продаж, а также имеют высокий уровень качества и оптимальное потребление электроэнергии по сравнению с данными фирмами.