Смекни!
smekni.com

Учебно-методическое пособие для студентов экономического и физико-математического факультетов (стр. 10 из 16)

— скорректированный (нормированный) коэффициент детерминации.

Нулевая гипотеза H0 :bi = 0.

Альтернативная гипотеза H1 : bI ¹ 0.

t-статистика имеет вид:

,

область принятия нулевой гипотезы.

Если выполняется данное условие, то принимается нулевая гипотеза, и регрессор xi признается незначимым. В противном случае принимается альтернативная гипотеза, и регрессор признаётся значимым.

F-тест (тест Фишера) на значимость всей регрессии.

Нулевая гипотеза H0 :R2 = 0.

Альтернативная гипотеза H1 :R2 ¹ 0.

,

область принятия нулевой гипотезы.

Если выполняется данное условие, то принимается нулевая гипотеза, и вся регрессионная модель признается незначимой. В противном случае принимается альтернативная гипотеза, и модель признаётся значимой.

Математический пакет MathCad

Рассмотрение случая двух регрессоров можно опустить, поскольку в этом случае необходимо уметь вычислять средние значения, коэффициент ковариации и дисперсию. Способы получения данных параметров были изучены нами ранее (лабораторная работа № 1). Поэтому рассмотрим случай множественной регрессии.

Математический пакет MathCad содержит большое количество встроенных функций для обработки матриц, которые позволяют получить обратную и транспонированную матрицы, вычислить определителя, собственные значения и собственный вектор матрицы и т. д. Данные функции позволяют вычислить коэффициенты модели множественной регрессии и их стандартные отклонения, используя исходные формулы.

Для получения доступа к матричным функциям необходимо либо используя пункт меню Вид, Панель инструментов активизировать панель Матрицы, либо используя математическую панель инструментов, нажать на кнопку Векторные и матричные операции. В любом случае появится дополнительная панель инструментов (рис. 12).

Рис. 12

Нет необходимости описывать каждую из этих кнопок, поэтому рассмотрим только необходимые в нашем случае. Первая кнопка в верхнем ряду позволяет вставить матрицу произвольной размерности, а третья позволяет получить обратную матрицу. Необходимо отметить, что все доступные функции обработки матриц можно получить, используя пункт меню Вставка, Функции и в диалоговом окне выбрать категорию Вектора и Матрицы.

Продемонстрируем возможности пакета по обработки матриц на примере таблицы 1, в которой наряду с данными о спросе (y) и цене (x1), включены данные о ценах на некоторый подобный товар (x2,x3) и средний доход населения (x4). Обобщённые данные представлены в таблице 12.

Таблица 12

Номер наблюдения Цена x1(р.) Цена на первый подобный товар x2 (р.) Цена на второй подобный товар x3 (р.) Средний доход населения x4 (т. р.) Спрос y (тыс. шт.)
1 15,09р. 24,30р. 12,85р. 5,09 125,1779
2 15,21р. 26,65р. 12,26р. 5,03 123,8094
3 15,28р. 25,22р. 13,42р. 4,80 121,175
4 15,49р. 26,59р. 12,05р. 4,95 116,9143
5 15,54р. 26,88р. 12,70р. 4,88 119,8643
6 15,62р. 24,74р. 12,41р. 4,96 118,0681
7 15,70р. 24,42р. 13,83р. 5,10 123,5887
8 15,91р. 25,79р. 13,10р. 4,90 117,0877
9 15,92р. 24,14р. 13,07р. 4,72 116,1699
10 15,95р. 26,70р. 12,40р. 4,81 118,3436
11 16,31р. 24,66р. 12,82р. 4,95 116,2008
12 16,33р. 24,04р. 12,48р. 4,88 111,4565
13 16,60р. 25,15р. 13,20р. 5,02 115,1026
14 16,69р. 24,10р. 12,40р. 4,80 110,1056
15 16,76р. 24,49р. 12,01р. 4,85 110,0231

Учитывая, что матрица X должна иметь на один столбец больше, чем число регрессоров, в котором находятся единицы [5, c. 69], и вектор-столбец Y содержит значение спроса, документ MathCad может иметь следующий вид:

На основании полученных данных можно записать множественную модель в виде: y = 113,938 – 6,095 x1 + 0,534 x2 + 2,588 x3 + 10,995 x4.

Сравнивая полученные данные с результатами парного регрессионного анализа (y = 240,14 – 7,7145x), можно сделать следующие выводы:

1. Изменилось влияние цены на спрос. Если в модели парной регрессии увеличение цены на единицу приводило к уменьшению спроса на 7,714 тыс. шт., то при рассмотрении множественной модели увеличение цены на единицу приводит к уменьшению спроса на 6,095 тыс. шт. (Причина данного изменения влияния цены будет рассмотрена нами далее, при изучении проблемы лабораторной работы № 8.)

2. Изменилось значение константы. В парной модели это значение было равно 239,96, во множественной — 113,93. Именно таким должен быть спрос, при условии, что значение всех регрессоров равно нулю. Как и для случая парной регрессии, это значение является во многом теоретическим.

3. На конечный спрос влияет цена на подобные товары. Например, при увеличении на единицу цены на первый подобный товар, спрос увеличивается на 0,534, а для второго подобного товара это значение равно 2,588. То есть можно говорить о том, что второй подобный товар в большей степени влияет на спрос.

4. Кроме цен на спрос также влияет и средний доход населения. При увеличении дохода на единицу спрос увеличивается на 10,995 тыс. шт.

Полученная модель является во многом формальной, поскольку она хоть и получена на основании статистических данных, не были проверены гипотезы о значимости каждого регрессора, да и всей регрессии в целом. Трудность при работе в пакете MathCad заключается в том, что нет дополнительных встроенных возможностей для проверки гипотез, поэтому все вычисления необходимо производить вручную, создавая необходимый документ. Данная работа часто бывает затруднительна для конечного пользователя. К тому же имеется достаточно сложный механизм передачи данных между MathCad и Excel. Поэтому рассмотрим программные продукты, которые имеют необходимый для анализа множественной регрессии инструментарий.

Электронная таблица Excel

В электронной таблице Excel имеется необходимый набор матричных функций, среди них можно отметить функции: МОБР(), которая выводит обратную матрицу, МУМНОЖ(), вычисляющая произведение двух матриц, ТРАНСП(), выполняющая операцию транспортирования матрицы. Этих функций достаточно для вычисления параметров множественной регрессии, однако они являются матричными, что имеет некоторую специфику при работе с ними. Документ, в котором будут использоваться данные функции, будет выглядеть громоздким, поскольку необходимо отдельно хранить элементы выполнения каждой матричной операции. Поэтому рассмотрим другие возможности Excel.

Как и для случая парной регрессии, для множественной регрессии имеется возможность использовать ту же самую надстройку Регрессия, однако в этом случае количество значений X должно в несколько раз превышать количество Y.

Перенеся таблицу 10 в Excel, в диалоговом окне надстройки Регрессия задав Входной интервал Y в виде G1:G16, а Входной интервал X в виде B1:F16 и установив опцию Метки, будет автоматически сгенерирована таблица 13.

Таблица 13

ВЫВОД ИТОГОВ
Регрессионная статистика
Множественный R 0,963541879

Продолжение табл. 13

R-квадрат 0,928412953
Нормированный R-квадрат 0,899778134
Стандартная ошибка 1,496311516
Наблюдения 15
Дисперсионный анализ
df SS MS F Значимость F
Регрессия 4 290,3694 72,59234 32,42252 1,06E–05
Остаток 10 22,38948 2,238948
Итого 14 312,7588
Коэффи- циенты Стандартная ошибка t-ста тистика P- значение Нижние 95 % Верхние 95 %
Y-пересечение 113,1921888 36,06499 3,138562 0,010536 32,83438 193,55
Цена x1(р.) –6,080773549 0,900492 –6,75273 5,03E–05 –8,08719 –4,07435
Цена на первый подобный товар x2 (р.) 0,55174938 0,452263 1,219975 0,250464 –0,45596 1,559454
Цена на второй подобный товар x3 (р.) 2,620192945 0,85151 3,077112 0,011698 0,722909 4,517476
Средний доход населения x4 (т. р.) 10,92686031 3,846179 2,840965 0,017519 2,357038 19,49668

Данная таблица нами рассматривалась уже не раз, поэтому остановимся только на том, что относится к случаю множественной регрессии. Например, в разделе Регрессионная статистика имеется пункт Нормированный R-квадрат, который содержит значение скорректированного коэффициента детерминации. При включении в модель незначимого регрессора данное значение будет уменьшаться.