Смекни!
smekni.com

Учебно-методическое пособие для студентов экономического и физико-математического факультетов (стр. 13 из 16)

При необходимости можно построить модель, в которой фиктивная переменная влияет как на наклон, так и на сдвиг.

До сих пор нами рассматривался случай, когда имеются всего два значения качества, то есть два вида продукции. Однако нередки случаи, когда необходимо проанализировать спрос для различных продуктов. Тогда необходимо вводить набор категорий — как конечный набор взаимоисключающих событий, полностью описывающий все возможности. Предположим, что исследуется влияние цены на спрос при наличии «старой», «обычной», «новой» и «самой новой» продукции.

В этом случае для описания этих категорий необходимо вводить набор фиктивных переменных по следующему правилу.

1. Число фиктивных переменных должно быть на единицу меньше, чем число категорий. В данном случае имеется четыре категории, а следовательно, необходимо ввести три фиктивные переменные, которые мы обозначим D1, D2, D3.

2. Выбрать произвольную категорию в качестве эталонной. Именно с этой категорий в последствии будут сравниваться все остальные. Для эталонной категории необходимо, чтобы значения всех фиктивных переменных равнялись нулю.

3. Для всех остальных категорий необходимо, чтобы одна из фиктивных переменных равнялась 1, в то время как значение всех остальных равно 0.

Достаточно легко можно расставить значения фиктивных переменных, используя ту же условную функцию ЕСЛИ. При наличии четырёх различных видов продукции необходимо вставить три дополнительных столбца, в которых будут находиться фиктивные переменных. Задать логические функции можно так, как показано в таблице 20.

Таблица 20

Номер наблюдения Вид Фиктивная переменная D1 Фиктивная переменная D2 Фиктивная переменная D3 Цена x1 (р.) Спрос
y (тыс.шт.)
1 =ЕСЛИ(B2= «обычный»;1;0) =ЕСЛИ(B2= «новой»;1;0) =ЕСЛИ(B2= «самой новый»;1;0) 15,09р. 125,1779

После копирования данных функций вниз для значения старой все фиктивные переменные будут равны нулю, для обычной — только значение первой фиктивной переменной будет равно 1 и т. д.

После этого можно вызвать надстройку Регрессия, у которой в качестве входного интервала X, необходимо указать значения всех фиктивных переменных D и нефиктивной переменной X, то есть задать Входной интервал X в виде С1:F16.

Полученные результаты поддаются достаточно простой интерпретации. Значение, находящееся напротив фиктивной переменной D1, показывает, насколько изменился спрос при переходе от эталонной к первой категории, то есть насколько различен спрос между «обычной» и «новой» продукцией. Аналогично интерпретируются значения, стоящие напротив других фиктивных переменных.

Задания для самостоятельной работы

1. Для данных своего варианта подобрать наилучшее воздействие фиктивной переменной (влияние на наклон или сдвиг). При этом категории «старый» и «обычный» воспринимать как одно значение, а категории «новый» и «самый новый» — как другое.

2. Определить, насколько изменяется спрос при переходе от одной категории к другой.

Лабораторная работа № 10

Гетероскедастичность и взвешенный метод наименьших квадратов

Цель: научиться оценивать наличие эффекта гетероскедастичности и использовать взвешенный метод наименьших квадратов.

Основные формулы и понятия:

Тест ранговой корреляции Спирмена

— коэффициент ранговой корреляции Спирмена,

где x — одна из объясняющих переменных,

— разность между рангом i-го наблюдения x и рангом модуля остатка в i-м наблюдении.

статистика.

Если в модели регрессии имеется более одной объясняющей переменной, то проверка гипотезы может выполняться с использованием каждой из них.

статистика

Условие принятия гипотезы

.

Если данное условие выполняется, то нулевая гипотеза о наличии гетероскедастичности будет принята при уровне значимости a.

Тест Голдфельда — Кванта

В этом случае все наблюдения необходимо упорядочить по мере возрастания значений x. Затем построить регрессионную модель для первых m и последних m наблюдений. Соответственно обозначим через ESS1 и ESS2 необъясненную сумму квадратов отклонений в каждой регрессии. Тогда статистика имеет вид

.

Если выполняется условие

, то гипотеза об отсутствии гетероскедастичности отвергается.

Взвешенный метод наименьших квадратов основан на минимизации суммы:

.

Электронная таблица Excel

К сожалению, в электронной таблице нет дополнительных инструментов, которые позволяли бы проверять гипотезы и реализовывать взвешенный метод наименьших квадратов. Однако данные тесты можно реализовать вручную. Так, например, для теста ранговой корреляции Спирмена необходимо выполнить следующие действия:

1. Отсортировать данные в таблице по возрастанию значений x, для чего необходимо выбрать пункт меню Данные, Сортировка, а затем выбрать столбец, в котором находятся значения x;

2. Придать каждому наблюдению ранг, для чего необходимо добавить новый столбец, в котором задать числа от 1 до n;

3. Вызвать из пакета анализа надстройку Регрессия, указав в диалоговом окне опцию Остатки. После выполнения данной надстройки появится дополнительная таблица, в которой содержатся номера наблюдений, прогнозы и остатки. Тот столбец таблицы, в котором находятся остатки, необходимо перенести к исходным данным. После выполнения этих действий наша таблица будет содержать четыре столбца: ранг наблюдения, упорядоченные значения регрессора x, значения y и значения остатков;

4. Отсортировать данные по возрастанию модулей остатков и добавить новый столбец рангов остатков, аналогичным образом задав значения от 1 до n;

5. В дополнительном столбце вычислить значения разности между двумя полученными рангами (это и будет значение Di);

6. На основании формул подсчитать коэффициент ранговой корреляции и статистику;

7. Проверить гипотезу можно посредством функции, которая вычисляет значение двусторонней критической точки распределения Стьюдента (лабораторная работа № 3).

Если выполнить данные действия для таблицы 1, то получим таблицу 21.

Таблица 21

Ранг по x Ценаx1(р.) Спрос y (тыс. шт.) Остатки Ранг по остаткам Разность рангов Di Di* Di
4 15,49р. 116,9143034 –3,7319 1 3 9
12 16,33р. 111,4565323 –2,67328 2 10 100
6 15,62р. 118,068067 –1,5813 3 3 9
14 16,69р. 110,1056432 –1,31194 4 10 100
9 15,92р. 116,169908 –1,12322 5 4 16
3 15,28р. 121,1749683 –1,11646 6 –3 9
15 16,76р. 110,023139 –0,84306 7 8 64
5 15,54р. 119,8642978 –0,39014 8 –3 9
8 15,91р. 117,0876924 –0,34387 9 –1 1
2 15,21р. 123,8094363 1,019821 10 –8 64
10 15,95р. 118,3436007 1,257187 11 –1 1
1 15,09р. 125,177912 1,426776 12 –11 121
11 16,31р. 116,2008486 1,847847 13 –2 4
13 16,60р. 115,102583 3,003645 14 –1 1
7 15,70р. 123,5886637 4,559903 15 –8 64
Сумма 572

Следовательно, значение ранговой корреляции Спирмена будет равно

А значение статистики будет

Выбрав уровень значимости 5 %, получаем критическую точку

. Данное значение получено формулой СТЬЮДРАСПОБР(0,05;13).

Поскольку условие

не выполняется, то гипотеза о наличии гетероскедастичности будет отклонена.

Для проверки подобной гипотезы на основании теста Гольдфельда — Кванта необходимо подобным образом отсортировать наблюдения по возрастанию значения x, а затем отдельно оценить каждую регрессионную модель для первой трети и для последней трети наблюдений, вычислив при этом объясненную сумму квадратов отклонений, получив тем самым значения. А затем просчитать статистику.