Смекни!
smekni.com

Учебно-методическое пособие для студентов экономического и физико-математического факультетов (стр. 11 из 16)

В разделе Коэффициенты содержатся значения всех коэффициентов, которые совпадают со значениями, полученными посредством MathCad, а кроме этого, стандартные ошибки статистики, значимости и доверительные интервалы для коэффициентов.

На основании данной таблицы можно сделать выводы о значимости каждого регрессора и всей регрессии в целом:

1. Само уравнение регрессии является значимым, поскольку Значимость F равна 1,06E-05, что меньше, чем 0,01. Проверить значимость всей регрессии можно и самостоятельно, поскольку в таблице выдается значение F-статистики, а критический уровень можно, как и в парном случае, найти с помощью функции FРАСПОБР. Верхнее число степеней свободы в данном случае равно 4, а нижнее10.

2. Коэффициент b1 является значимым при любом уровне значимости, поскольку его значимость равна 5,03E-05. Следовательно, цена на товар, а в наших обозначениях регрессор x1, влияет на спрос.

3. Коэффициенты b3, b4, можно признать значимыми, поскольку соответствующие значения равны 0,01169 и 0,01752, что несколько превосходит значение 0,01, но все же меньше, чем значение 0,05. Следовательно, на формирование значения спроса также влияет цена на второй подобный товар и средний доход населения.

4. Коэффициент b2 является незначимым, поскольку соответствующее значение равно 0,25, следовательно, цена на первый подобный товар x2 не влияет на значение спроса.

Исходя из всего вышесказанного, разумно построить регрессионную модель, в которой отсутствуют незначимые регрессоры. Для этого в электронной таблице Excel необходимо удалить тот столбец, в котором находятся значения переменой x3, и вызвать надстройку Регрессия.

Таблица 14

ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R 0,9579
R-квадрат 0,9177
Нормированный R-квадрат 0,8953
Стандартная ошибка 1,5291
Наблюдения 15
Дисперсионный анализ
df SS MS F Значимость F
Регрессия 3 287,037 95,67901 40,91741 2,94E–06
Остаток 11 25,72179 2,338345
Итого 14 312,7588

Продолжение табл. 14

Коэффи- циенты Стандартная ошибка t-ста тистика P- значение Нижние 95 % Верхние 95 %
Y-пересечение 142,2167 27,6999 5,134194 0,000326 81,24956 203,1838
Цена x1(р.) –6,61474 0,804244 –8,2248 5,01E–06 –8,38487 –4,84461
Цена на второй подобный товар x3 (р.) 2,240018 0,809838 2,766008 0,018358 0,457576 4,02246
Средний доход населения x4 (т. р.) 10,56105 3,918663 2,695063 0,02084 1,936122 19,18597

В данном случае, хотя значения и обычного и скорректированного (нормированного) коэффициента детерминации несколько уменьшилось по сравнению с общим случаем, все равно, модель, в которой не учитывается значения x2, является лучшей, поскольку в данном случае присутствуют только значимые регрессоры. Итак, наилучшая линейная множественная модель регрессии имеет вид:

y = 142,21 – 6,61 x1 + 2,24 x3 + 10,56 x4.

Проанализировав данную модель, можно сделать выводы о влиянии каждого из регрессоров на значение спроса.

После нахождения значимых регрессоров и определения лучшей линейной модели, разумной является задача поиска лучшей нелинейной модели (логарифмической, степенной, показательной и т. д.). Построение подобных моделей осуществляется аналогично парному случаю (лабораторная работа № 6).

Задания для самостоятельной работы

1. Найти параметры регрессионной модели для заданий своего варианта, используя математический пакет MathCad и электронную таблицу Excel.

2. Подберите наиболее подходящую линейную модель (только значимые регрессоры).

3. Подобрать лучшую нелинейную множественную модель.

Лабораторная работа № 8

Спецификация переменных
и проблема мультиколлинеарности

Цель: научиться распознавать влияние эффекта мультиколлинеарности и находить варианты избавления от этого эффекта.

Основные формулы и понятия:

Отсутствующая переменная:

истинная модель;

оцениваемая модель.

В этом случае

Электронная таблица Excel

Эффект мультиколлинеарности возникает тогда, когда коэффициент корреляции между регрессорами близок к единице, в то время как коэффициент корреляции между регрессором и зависимой переменной мал. Как правило, выделяют значение в 0,8.

Для анализа влияния мультиколлинеарности можно проанализировать значение ковариационной матрицы, которую можно получить, используя надстройку Корреляция. Поскольку, как уже было определенно ранее, лучшей является модель, в которой не учитывается значения регрессора x2, то построим корреляционную матрицу без учета значений на первый подобный товар. Данная матрица имеет вид, изображенный в таблице 15.

Таблица 15

Цена
x1 (р.)
Цена на подобный товар x3 (р.) Средний доход населения x4 (т. р.) Спрос y (тыс.шт.)
Цена x1(р.) 1
Цена на подобный товар x3 (р.) –0,17012 1
Средний доход населения x4 (т. р.) –0,33828 0,195127 1
Спрос y (тыс. шт.) –0,88704 0,423668 0,555581 1

Начнем рассмотрение результатов данной таблицы с последней строки, в которой находятся частные коэффициенты корреляции зависимой переменной y и регрессоров x1, x3 , x4. Имеется некоторая взаимосвязь между каждым регрессором и спросом, при этом максимальное значение коэффициента корреляции равно –0,887 и говорит о существенной связи цены x1 и спроса y. Именно эта парная регрессионная модель строилась ранее (лабораторная работа № 2), и это значение коэффициента корреляции было получено в лабораторной работе № 1.

Все остальные коэффициенты корреляции значительно меньше, поэтому нет оснований утверждать, что присутствует эффект мультиколленеарности, однако в некоторой незначительной степени этот эффект имеет место.

Если было подтверждено наличие эффекта мультиколлинеарности, то один из возможных способов её устранения либо в укрупнении регрессоров, либо в их исключении.

На основании полученных коэффициентов частной корреляции нетрудно самостоятельно подсчитать значение коэффициента детерминации R2, или, как его ещё иногда называют, множественного коэффициента корреляции [5, c. 73].

Рассмотрим теперь более подробно тот факт, как и почему изменяется значение коэффициентов регрессии в зависимости от того, какая модель рассматривается. Ещё раз напомним, что в парном случае модель имела вид:

y = 239,96 – 7,703x1,

а во множественном случае лучшая модель будет

y = 142,21 – 6,61 x1 + 2,24 x3 + 10,56 x4.

В работе [4, c. 243] рассматривается произвольный случай, когда имеется произвольное количество регрессоров, часть из которых могут оказаться лишними. Строятся статистики, которые позволяют определить наилучшую модель.

В работе [5, c. 78] рассмотрены частные случаи. Это модель с отсутствующей переменной, когда вместо двух, реально присутствующих в модели регрессоров, рассматривается парный случай, и модель с лишней переменной, когда исходная модель является парной, а она рассматривается как множественная. В случае лишней переменной происходит только потеря эффективности, в случае отсутствующей происходит нарушение наиболее важного свойства, а именно, нарушается несмещённость оценки. При этом показано, что математическое ожидание коэффициента в парной случае будет иметь вид

.

Для вычисления найдем ковариационную матрицу (таблица 16).

Таблица 16

Цена x1 (р.) Цена на подобный товар x3 (р.) Средний доход населения x4 (т. р.) Спрос y
(тыс. шт.)
Цена x1 (р.) 0,275665
Цена на подобный товар x3 (р.) –0,04468 0,250289
Средний доход населения x4 (т. р.) –0,01923 0,010569 0,011722
Спрос y (тыс. шт.) –2,12663 0,967845 0,274663 20,85059

Используя полученные данные, нетрудно вычислить