Используя вышеописанные вычисления можно, хотя это достаточно трудно, проверить модель на гетероскедастичность, однако нет принципиальных методов для реализации взвешенного метода наименьших квадратов. Поэтому рассмотрим программные пакеты, предназначенные специально для статистических вычислений. В настоящее время имеется большое количество таких программ, разнообразных как по внешнему интерфейсу, так и количеству предлагаемых возможностей. Мы остановимся на пакете SPSS for Windows поскольку интерфейс данной программы во много похож на Excel.
Пакет обработки статистических данных SPSS for Windows
Данную программу запускают, как и все программы в среде Windows, а именно либо используя ярлык, либо клавишу Пуск, Программы. Сразу после запуска появляется диалоговое окно, в котором предлагается выбор дальнейшей работы. Выбрав пункт Запуск введения приводит к запуску автономной обучающей программы в формате html, в которой излагаются все основные возможности программы. Кроме этого можно задавать новые данные, запросы и источники.
Выбрав пункт меню Тип Данных, загрузится программа, рабочее поле которой состоит из ячеек, что во многом похоже на электронную таблицу, однако имеются и принципиальные отличия, на которых мы сейчас остановимся.
В нижней части рабочего поля располагаются закладки, на которых имеются надписи Панель данных и Вид переменных.
Используя закладку Вид переменных можно задать структуру, задав информацию по каждому столбцу будущей таблицы: имя переменной, тип хранящийся информации, её размер, надписи, метки, выравнивание, и т. д.
Зададим три различных переменных с именами Price (Цена), Income (Средний доход), Demand (Спрос). Задавать имена можно только английскими буквами и не более 8 символов. Выберем для них цифровой тип, количество разрядов, равное 8, и количество цифр после запятой, равное 2. Перейдя на закладку Панель данных, получим окно (рис. 13).
Рис. 13
Рис. 14
Теперь на панели данных необходимо задать значения переменных для любого количества элементов в выборке. При необходимости можно вставить дополнительные переменные и варианты (случаи). В отличие от Excel, в котором адрес ячейки состоял из номера столбца — буквы и номера строки — цифры, в системе SPSS адрес состоит из номера случая и имени переменной. Зададим значение этих переменных аналогичные таблице 10, при этом необходимо отметить, что нельзя непосредственно копировать данные из электронной таблицы, поскольку для этого предназначены специальные механизмы подключения внешних данных.
Для получения параметров множественной регрессии необходимо выбрать пункт меню Анализ, Регрессия, Линейный, после чего появится диалоговое окно (рис. 14).
В левой части окна находятся все числовые переменные, на основании которых можно строить регрессию. Выбрав подчиненную переменную demand, а независимые переменные price и income, получим окно (рис. 15).
Рис. 15
В левой части данного окна располагается структура полученного отчета, а в правой — компоненты.
В пункте VARIABLES ENTERED/REMOVED выдается основная информация по модели, а именно зависимые и независимые переменные и используемые методы; в MODEL SUMMARY — значение коэффициента детерминации. ANOVA — объясненная, необъясненная и общая сумма квадратов, а также значение F-статистики. COEFFICIENT — значение коэффициентов, их стандартные ошибки, значения t-тестов и значимости.
Анализируя полученные таблицы, можно прийти к выводу, что вид полученных результатов во многом схож с той таблицей, которую генерирует Excel, с тем отличием, что таблица всегда располагается в виде нового объекта (отчета).
Данный отчет можно хранить независимо от исходной таблицы, при этом его можно сохранить с расширением spo (вывод), в отличие от данных, которые будут храниться в файле с расширением sav (стандартное расширение файлов, созданных программой SPSS).
Аналогичным образом можно построить любые варианты множественной парной регрессии, и сохранять отчеты в различных или одном файле.
Для реализации метода взвешенных наименьших квадратов необходимо задать ещё переменную, например, под именем WLS, в которой задаётся вес каждого наблюдения. После этого необходимо в диалоговом окне Линейная регрессия перенести данную переменную в пункт вес WLS. В этом случае коэффициенты будут вычисляться на основании взвешенного метода наименьших квадратов.
Задания для самостоятельной работы
1. Провести исследование табличных данных (номер варианта соответствует номеру таблицы) на наличие гетероскедастичности, между значением y и каждым регрессором отдельно, используя электронную таблицу Excel:
a) Тестом ранговой корреляции Спирмена;
b) Тестом Гольдфельда — Кванта;
2. Найти значения параметров регрессии, используя взвешенный метод наименьших квадратов и пакет обработки статистических данных SPSS:
a) взяв в качестве весов значения из столбца;
b) задав значение весов по правилу:
1) если значение x меньше 5, то вес равен 1,
2) если значение x меньше 10, то вес равен 4,
3) значение весов равно 7, во всех остальных случаях;
3. Сравнить полученные результаты.
Автокорреляция и обобщённый метод
наименьших квадратов
Цель: научиться оценивать наличие эффекта автокорреляции первого порядка и использовать Кохрейна — Оркатта, а также обобщённый метод наименьших квадратов.
Основные формулы и понятия:
критерий Дарбина — Уотсона.
Если d < , положительная автокорреляция имеет место;
если d > , положительной автокорреляции нет;
если <d< , то вывод сделать нельзя.
Вывод об отрицательной автокорреляции делается на основании симметричных значений.
Метод Кохрейна — Оркатта устранения автокорреляции.
Предполагая, что значение автокорреляции известно, необходимо оценить модель:
,где
,где значение параметра p определяется из регрессионной модели вида:
.Обобщённый метод наименьших квадратов основан на минимизации суммы:
,где W — корреляционная матрица случайных составляющих
В этом случае значения параметров модели будут вычисляться по формуле:
.Электронная таблица Excel
Для вычисления значения статистики Дарбини — Уотсона в электронной таблице Excel, так же как и для проверки теста на наличие гетероскедастичности, нет специальных средств, однако имеются достаточные возможности при реализации надстройки Регрессия. Так, достаточно выполнить следующие действия:
1. Вызвать из пакета анализа надстройку Регрессия, указав в диалоговом окне опцию Остатки. После выполнения данной надстройки появится дополнительная таблица, в которой содержатся номера наблюдений, прогнозы и остатки;
2. Найти коэффициент корреляции между ei и ei+1;
3. Найти значение критерия по приближенной формуле.
Кроме этого можно найти и точное значение критерия, однако полученные результаты не будут сильно отличаться. Провести анализ данных на основании значений
и .Для реализации метода Кохрейна — Оркатта необходимо знать значение p, которое, как правило, неизвестно. Его надо оценить, для чего получают параметры регрессионной модели вида:
.Для подсчета статистики Дарби — Уотсона мы уже получали коэффициент корреляции (пункт 2). Теперь необходимо построить данную регрессионную модель, получить тем самым оценку параметра p.
Математический пакет MathCad
Для реализации обобщённого метода наименьших квадратов можно воспользоваться возможностями данного пакета, поскольку будут незначительные отличия при вычислении параметров, основанные на использовании корреляционной матрицы. Как правило, значения данной матрицы неизвестны, поэтому их необходимо подбирать самостоятельно. Общий вид документа, реализующего обобщённый метод наименьших квадратов, имеет следующий вид