Смекни!
smekni.com

Множественная регрессия и корреляция (стр. 2 из 3)

Проверка мультиколлинеарности факторов может быть проведена методом испытания гипотезы о независимости переменных

. Доказано, что величина
имеет приближенное распределение
с
степенями свободы. Если фактическое значение
превосходит табличное (критическое)
, то гипотеза
отклоняется. Это означает, что
, недиагональные ненулевые коэффициенты корреляции указывают на коллинеарность факторов. Мультиколлинеарность считается доказанной.

Для применения МНК требуется, чтобы дисперсия остатков была гомоскедастичной. Это значит, что для каждого значения фактора

остатки
имеют одинаковую дисперсию. Если это условие не соблюдается, то имеет место гетероскедастичность.

При нарушении гомоскедастичности мы имеем неравенства

При малом объеме выборки для оценки гетероскедастичности может использоваться метод Гольдфельда-Квандта. Основная идея теста Гольдфельда-Квандта состоит в следующем:

1) упорядочение

наблюдений по мере возрастания переменной
;

2) исключение из рассмотрения

центральных наблюдений; при этом

-число оцениваемых параметров;

3) разделение совокупности из

наблюдений на две группы (соответственно с малыми и с большими значениями фактора
) и определение по каждой из групп уравнений регрессии;

4)определение остаточной суммы квадратов для первой

и второй
групп и нахождение их отношения:
.

При выполнении нулевой гипотезы о гомоскедастичности отношение R будет удовлетворять F-критерию со степенями свободы

для каждой остаточной суммы квадратов. Чем больше величина R превышает табличное значение F-критерия, тем более нарушена предпосылка о равенстве дисперсий остаточных величин.

Уравнения множественной регрессии могут включать в качестве независимых переменных качественные признаки (например, профессия, пол, образование, климатические условия, отдельные регионы и т. д.). Чтобы ввести такие переменные в регрессионную модель, их необходимо упорядочить и присвоить им те или иные значения, т. е. качественные переменные преобразовать в количественные.

Такого вида сконструированные переменные принято в эконометрике называть фиктивными переменными. Например, включать в модель фактор «пол» в виде фиктивной переменной можно в следующем виде:

Коэффициент регрессии при фиктивной переменной интерпретируется как среднее изменение зависимой переменной при переходе от одной категории (женский пол) к другой (мужской пол) при неизменных значениях остальных параметров. На основе t-критерия Стьюдента делается вывод о значимости влияния фиктивной переменной, существенности расхождения между категориями.

Типовая задача № 1

По 30 территориям России имеются данные, представленные в табл. 1.

Таблица 1

Признак Среднее значение Среднее квадратическое отклонение Линейный коэффициент парной корреляции
Среднедневной душевой доход,руб., y 86,8 11,44 -
Среднедневная заработная плата одного работающего, руб., x1 54,9 5,86
Средний возраст безработного,лет, x2 33,5 0,58

Требуется:

1. Построить уравнение множественной регрессии в стандартизованной и естественной форме; рассчитать частные коэффициенты эластичности, сравнить их с b1 и b2 , пояснить различия между ними.

2. Рассчитать линейные коэффициенты частной корреляции и коэффициент множественной корреляции, сравнить их с линейными коэффициентами парной корреляции, пояснить различия между ними.

3. Рассчитать общий и частные F-критерии Фишера.

Решение

1. Линейное уравнение множественной регрессии y от х1 и х2 имеет вид:

. Для расчета его параметров применим метод стандартизации переменных и построим искомое уравнение в стандартизованном масштабе:
.

Расчет b-коэффициентов выполним по формулам

Получим уравнение:

Для построения уравнения в естественной форме рассчитаем

и
, используя формулы для перехода от
к
:

Значение

определим из соотношения

Для характеристики относительной силы влияния

и
на
рассчитаем средние коэффициенты эластичности:

С увеличением средней заработной платы

на 1% от ее среднего уровня средний душевой доход
возрастает на 1,02% от своего среднего уровня; при повышении среднего возраста безработного
на 1% среднедушевой доход
снижается на 0,87% от своего среднего уровня. Очевидно, что сила влияния средней заработной платы
на средний душевой доход
оказалась больше, чем сила влияния среднего возраста безработного
. К аналогичным выводам о силе связи приходим при сравнении модулей значений
и
:

.

Различия в силе влияния фактора на результат, полученные при сравнении

и
, объясняются тем, что коэффициент эластичности исходит из соотношения средних:
а
-коэффициент - из соотношения средних квадратических отклонений:
.