4). Сглаживание данных. Общеизв-но, что врем тренды стр-ся на основе сглаж-ия данных по врем рядам.
=> каждая след-ая средняя в нашем вар-те входить 2 предидущ знач-ия, т.е. ср зав=т др от др. И это служит причиной наличия положит а/коррел у врем рядов.
Последствия и способы обнаружения автокорреляции. Графический метод.
Если регресс-я модель рассч-сь по МНК, то
1). Оценки пар-ров ур-ия оставаясь несмещ-ми отн-но среднего перестают быть эф-ми, т.е. наилучшими из всех возм-х.
2). Дисп-ии этих оценок вычисл-ые по станд формулам б смещенными в сто-ну убывания, что повлечет за собой увелич-е t-статистик.
что м привести к признанию стат-ки знач-ми (tbj>tкр) тех переем-х в ур-ии, кот-ые такими не яв-ся.
3). Вел-на So²=∑ei²/(n-m-1) также окаж-ся смещенной отн-но теоретич дисп-ии откл-ий σ², а поэтому применение t и F статистик окаж-ся необоснов-м, б получены неправ-е выводы по модели и ухуд-ся ее прогозные кач-ва.
Чтобы обнаружить а/коррел исп-т неск0ко методов.
Графический метод.
В этом случае стр-ся графики, связыв-ие номер выбора выборочной компоненты или время, для кот-го взята переем-я и соответ-ие знач-ия для откл-ий, получ-х исходя из рассчит-го ур-ия регр-ии.
4 графика.
На первых 3-х графиках изобр-на нек-ая зав-ть вел-ны откл-ия от № выборочной пары. М предпол-ть, что в модели присут-т а/коррел остатков. На 4 графке такой зав-ти нет, поэтому мы м предпол-ть отсут-ие а/коррк. Причем сч-ся, что ≈ 10% точек м.б. неподчинены осн зав-ти и а/коррел отсут-т.
Метод Дарбина-Уотсона.
По нему рассч-ся к-т а/коррел остатков первого пор-ка, кот-ый совп-т со знач-м коэф-та выбороч-й коррел
Но мы знаем, что мат ожидания (ср знач) откл-ий =0 в методе МНК => получили
Но на практике для такого анализа исп-т стат-ку DW, для кот-й сущ-т расчет-е таблицы
Покажем, что эти вел-ны дейст-но совп-т. Для этого преобр-м числ-ть
Последняя ∑ отл-ся от первой на 1 слогаемое. А т.к. знач-е ei невелики, то мы м предпол-ть, что они м/у собой совп-т. Тогда
≈2∑ei² -2∑eiei-1
Тогда
А т.к. мы предпол-ли, что ∑ei² ≈∑ei-1², то
=> ста-ка DW б вести аналог-но поведению выбор коэф-та коррел м/у откл-ми.
Если r eiei-1 =1, DW=0
r eiei-1 =0, DW=2
r eiei-1 =-1, DW=4
Т.е. все знач-я этой стат-ки нах-ся в инт-ле (0;4) при 2 а/коррел остатков отсут-т. И вопрос закл-ся в том, насколько м эта стат-ка откл-ся от 2, чтобы мы м утвер-ть, что а/коррел отсут-т.
Таблицы DW построены с.о., что в соот-ии с заданным n выбир-ся опр-ая таблица, входами в кот-ую яв-ся m-число объясняющих переем-х и n- объем выборки
Таблица
Предпол-м n=k и в модели исп-ны m=2. Тогда из таблицы б найдены 2 числа dl и du, dl<du<2. Мы сможем отложить на шкале их значения.
В зав-ти от того, куда попадет значение DW, мы м делать выводы о наличие или отсут-ии а/коррел остатков в модели. Но т.к. по этому методу мы ничего не м сказать окончат-но при попадании в зоны неопр-ти.
Метод рядов.
Основан на учете чередования знаков у отклонений ei. Для этого поступают с.о. Нап-р для нашей задачи, рассч-й для парной регр-ии, выставим посл-ть знаков по откл-ию.
(--)(++)(--)(+++)(-)(++) n=12
Затем объед-ся инт-лы совпадающих знаков. Каждая из образ-ых послед-тей наз-ся рядов (ряд одинак знаков). В нашей задаче к=6. Кол-во одинак знакв в отдел-м ряду наз-ся длиной ряда. Если рядов сущ-но мало по отн-ию к объему выборки n, то вер-на положит а/коррел, а если их много, то возм-на отрицат а/коррел.
Для более детального анализа поступ-т с.о. Пусть n – объем выборки. n1 – кол-во положит знаков. n2 – отрицат. В нашем случае n1=7 n2=5.
При достаточно большом кол-ве наблюдений n>20, мы м посчитать мат ожидание кол-ва рядов знаков.
и дис-ию разброса этого кол-ва рядовТогда, если принять, что мат ожидание м оценить ч/з таблицы распред-ия кол-ва рядов, кот-ое д нах-ся в инт-ле
, то при попадании в этот инт-л а/коррел остатков б отсут-ть. В противном случае, если , то у нас положит а/коррел, а если k≥ - отрицат. Для такого распред-я б построены таблицы Экхарда, в соот-ии с кот-ми м опр-ть нижнюю и верхнюю гр-цу числа К. К1<K<K2 по 2 входам +n1 и –n2.Таблицы имеют стр-ру
Нижняя граница К1
Таблица имеет своб поля. Если попадаем в своб поле, то к1 выбираем наименьший в этой строке.
Верхняя гр-ца К2.
Выбор осущ-ся также как для К1 и знач-я берутся для своб полей также как и в 1 случае.
В отл-ии от критерия DW этот метод дает однознач ответ, причем н помнить, что метод DW не применим для регресс моделей, содерж-х в кач-ве объясн-х переем-х нек-ые лаговые объясн вел-ны. Даже если этот лаг имеет 1 пер-д. Нап-р в модели
. Для таких моделей исп-ся спец n-стат-ка Дарбина, по кот-й , где - вычис-ся из стат-ки DW. Обычно ее принимают =1-1/2DW, т.к. . обычно при-т равной квадрату станд-й ошибки коэф-та при лаговой переменной. В нашем примере .Методы устранений автокорреляции.
Изв-но, что осн причиной наличия в ур-ие регр-ии случ откл-ия яв-ся не учет всех объясняющ перем-х в модели и ошибки в выборе зав-ти.
Поэтому устранять а/коррел нач-т с того, что пробуют ввести в модель еще какую-то сущест (значимую) объясняющ переем-ую. Если это не помогает, то пытаются исходя из теоретич знаний изм-ть форму зав-ти в модели.
Но если все разумные приемы совершенст-я модели исчерпаны, а а/коррел все-таки сохр-ся, то м предпол-ть, что она связана с какими-то внутр св-вами переем-й.
Тогда в моделях прибегают к а/регрессионным преобр-м, суть кот-ых закл-ся в след-ем.
А/регр преобр-е 1 пор-ка получ-т с.о. Запис-т теорет модель для нек-го года t
yt=βo+β1xt+εt
Тогда для предыдущего года она б иметь вид
Вычтем из 1 ур-ия 2.
В этом случае мы получаем модель, построенную на приращенных переем-х в году t.
Δyt=β1Δxt+Ut, где Ut – случ вел-на = εt – εt-1
Для таких моделей исход выборка сокр-ся на 1 и если n-1>3m+1, то мы м построить новую модель включающую в себя своб член bo, кот-ый б гаран-ть прохождение ч/з ср точку нов выборки.
Δỹt=bo+b1Δxt+Ut
Δỹt*=bo+b1Δxt*+Ut
В такой модели а/коррел остаткв уже наверняка б отсут-ть. Если же объем выборки не позвол-т уменьшить ее на 1, то прибегают к вспом преобр-ям исх-х переем-х с исп-ем стат-ки DW.
В этих случаях также а/крел из модели б.устран-ся.
Кроме метода разности прим-ся еще неск-ко методов. Нап-р когда в кач-ве нов переем-й вводятся неполн полусуммы значений переем-х по выборке, а только их половинные вел-ны.
yt*= (yt + yt-1)/2
xt*= (xt + xt-1)/2
Метод исп-ия сглаж по люб кол-ву интервалов изм переем-ых. Но все-таки прежде чем исп-ть эти вспом методы, необ-мо сначала попроб-ть изм-ть специф-иб модели.
Мультиколлиниарность.
Если объясняющ переем-ые связаны строгой лин зав-тью, то гов-т, что м/у ними сущ-т соверш мульт-ть. На практике м столконуться не с соверш, а с сильной мульт-тью, т.е. когда ур-нь коррелир-ти м/у объясняющ-ми переем-ми >0,7.
|rxkxj|>037
0≤|rxkxj|≤1
Мульт-ть яв-ся проблемой для ур-ий множест регр-ии. Покажем как она прояв-ся в ур-ии множест регр-ии при m=2 и при усл-ии, что м/у х2 и х1 сущ-т строгая лин зав-ть.
х2=γo+γ1x1
Тогда ỹ=βo+β1x1+β2x2+ε
ỹ=βo+β1x1+β2(γo+γ1x1)+ε = (βo+β2γo)+ (β1+β2γ1)x1+ε =
Обозначим выр-ия, чтоящие в скобках за АО и а1 =АО+а1х1+ε
Получили ур-ие парной регр-ии, в соот-ии с кот-м, используя метод МНК, найдем значения для оценок а0 и а1. Но от этих оценок мы не сможем перейти к оценкам коэф-в исх ур-ия βo β1 β2, т.к. получили для их опр-ия всего 2 ур-ия.
{аО= βo+β2γo
{а1= β1+β2γ1
γo и γ1 нам изв-ны.
Т.о. соверш муль-ть не позвол-т однозначно опр-ть коэф-ты в ур-ии множест регр-ии, т.к. таких коэф-в всегда б на 1 >, чем ур-ий => не сможем сделать выводы о знач-ти этих коэф-в и не сможем опр-ть какой вклад дает каждая из объясн-х перем-х в поведение завис перем-й.
Но соверш мульт-ть бывает только на теории, на практике обычно возм-на сильная мульт-ть. В этом случае зав-ть наз-ся несоверш мульт-ть.
Графически это сост-ие м проиллюстр-ть с.о.:
4 графика:
1) Муль-ть отсут-т. Каждая из объясн-х перем-х оказ-т изолир-е влияние на у. 2) и 3) м/у х1 и х2 сущ-т зав-ть, кот-ую м изм-ть ч/з коэф-т выбороч коррел rх1х2.