Задача 2
По данным газеты «Из рук в руки» была сделана мной выборка данных о стоимости квартир на вторичном рынке за определенный период (от 25 мая 2009г). Выборка содержит 20 данных. В качестве факторов, влияющих на стоимость квартир выбрала число комнат (х1), общая площадь (х2), жилая площадь (х3), площадь кухни (х4). Необходимо построить уравнение регрессии, характеризующее зависимость цены от всех качеств. Оценить экономический смысл и значимость полученного уравнения.
1. Вводим данные в таблицу (EXCEL) – столбцы № x1, х2, х3, х4,y. Для удобства проведения расчетов поместим результаты промежуточных расчетов в таблицу [Приложение1]
Найдем средние квадратические отклонения признаков:
σy =

= 1556,86;
σx1 =

= 1,43;
σx2 =

= 29,74;
σx3 =

= 19,63;
σx4 =

= 5,90;
2. Вычисление параметров линейного уравнения множественной регрессии.
Для нахождения параметров линейного уравнения множественной регрессии
y = a + b1x1 + b2x2 + b3x3 + b4x4.
Найдем матрицу парных коэффициентов корреляции (Данные

Анализ данных

Корреляция)
Получаем следующий результат:
1 столбец матрицы содержит коэффициенты корреляции y с каждым из факторов x. Таким образом, наиболее сильное влияние на стоимость квартиры оказывают факторы x2;x3;x4.
С помощью инструмента Регрессия (Данные

Анализ данных

Регрессия) получаем следующие результаты:
| Регрессионная статистика |
| Множественный R | 0,951256 |
| R-квадрат | 0,904889 |
| Нормированный R-квадрат | 0,879526 |
| Стандартная ошибка | 554,416 |
| Наблюдения | 20 |
| Дисперсионный анализ |
| | df | SS | MS | F | Значимость F |
| Регрессия | 4 | 43865823 | 10966455,67 | 35,6775234 | 1,69079E-07 |
| Остаток | 15 | 4610657 | 307377,1554 |
| Итого | 19 | 48476480 |
| | Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% |
| Y-пересечение | -688,384 | 308,7638 | -2,229485916 | 0,04148909 | -1346,49885 | -30,2701 |
| x1 | 67,88611 | 351,3708 | 0,193203645 | 0,84939123 | -681,042959 | 816,8152 |
| x2 | 39,08366 | 21,70148 | 1,800967381 | 0,09184344 | -7,17195183 | 85,33927 |
| x3 | -31,251 | 130,6937 | -0,239116437 | 0,81425164 | -309,817992 | 247,316 |
| x4 | 144,2302 | 404,6624 | 0,35642105 | 0,72648905 | -718,287253 | 1006,748 |
Таким образом, получили уравнение множественной регрессии:
yx = 67,89x1 + 39,08x2 - 31,25x3 +144,23x4 – 688,38
Экономический смысл уравнения: при увеличении числа комнат квартиры х1, цена квартиры увеличивается на 67,89 тыс. руб.; при увеличении общей площади квартиры х2, цена квартиры увеличивается на 39,08 тыс. руб.; при увеличении жилой площади квартиры х3, цена квартиры уменьшается на 31,25 тыс. руб.; при увеличении площади кухни х4, цена квартиры увеличивается на 144,23 тыс.руб.
- Остаточная дисперсия: σ2 = 230532,9.
- Средняя ошибка аппроксимации:
= 19%. Качество модели, исходя из относительных отклонений по каждому наблюдения, признается плохим, т.к. средняя ошибка аппроксимация превышает 15%.- Множественный коэффициент корреляции R= 0,951.
- Коэффициент детерминации R2 = 0,905. Нескорректированный коэффициент детерминации R2 оценивает долю дисперсии стоимости за счет предоставленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет 90,5% и указывает на весьма высокую степень обусловленности вариации стоимости с вариацией факторов, т.е. на весьма тесную связь факторов со стоимостью.
- Cкорректированный коэффициент детерминации
2 = 0,88 определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Все четыре коэффициента указывают на весьма высокую 88% детерминированность стоимости y в модели с факторами x1, х2, х3, х4.3.Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает
-критерия Фишера:Число наблюдений n =20, число независимых переменных m=4, отсюда
k1 =4, k2 =20-4-1 =15.
Fфакт. =
= 35,68.Получили, что Fфакт. > Fтабл. = 3,06 (при n=20), т.е. вероятность случайно получить такое значение F-критерия не превышает допустимый уровень значимости 5%. Таким образом, подтверждается статистическая значимость всего уравнения и показателя тесноты связи.
4. Оценим статистическую значимость параметров чистой регрессии с помощью t- критерия Стьюдента.
Фактические значения t-критерия:
tx4 = b4/se4 = 144,23/404,66 = 0,356;
tx3 = b3/se3 = -31,251/130,694= - 0,239;
tx2 = b2/se2 = 39,08/21,7 =1,80;
tx1= b1/se1 = 67,89/351,4 = 0,193.
Табличное значение критерия при уровне значимости α=0,05 и числе степеней k = 15 составит tтабл = 2,13.
Таким образом, признается статистическая значимость параметра x4, т.к. tx4>tтабл, и случайная природа формирования параметра x1,x2,x3, tx1<tтабл, tx2<tтабл, tx3<tтабл.
Доверительные интервалы для параметров чистой регрессии:
-681,04
x1
816,82; -309,82
x3
247,32;-7,17
x2
85,34; -718,29
x4
1006,75.Выводы:
- Уравнение множественной регрессии
yx = 67,89x1 + 39,08x2 - 31,25x3 +144,23x4 – 688,38.
Экономический смысл уравнения: при увеличении числа комнат квартиры х1, цена квартиры увеличивается на 67,89 тыс. руб.; при увеличении общей площади квартиры х2, цена квартиры увеличивается на 39,08 тыс. руб.; при увеличении жилой площади квартиры х3, цена квартиры уменьшается на 31,25 тыс. руб.; при увеличении площади кухни х4, цена квартиры увеличивается на 144,23 тыс.руб.Множественный коэффициент корреляции R=0,95 указывает на связь между переменными x и y прямая, сильная, тесная, т.е. величина потребительских расходов значительно зависит от денежных доходов.