Смекни!
smekni.com

Учебно-методическое пособие для студентов экономического и физико-математического факультетов (стр. 5 из 16)

Рассмотрим раздел дисперсионный анализ. В столбце SS выдаются все виды сумм квадратов отклонений. В данном случае в первой строке, которая соответствует надписи Регрессия, выдается объясненная сумма квадратов отклонений RSS, во второй строке — Остаток — выдается необъясненная (остаточная) сумма квадратов отклонений ESS, в третьей строке — Итого — выдается общая сумма квадратов отклонений TSS.

В последнем разделе, который не имеет названия, будет интерпретироваться как раздел — коэффициенты, содержится полная информация по коэффициентам. Рассмотрим значения, полученные в столбце Коэффициенты. Пункт Y-пересечение выдает значение коэффициента a. Пункт Цена x (р.) выдает значение коэффициента b.

Представленные в таблице значения полностью совпадают с данными, полученными посредством статистических функций и линий тренда на точечной диаграмме.

В диалоговом окне Регрессия имеется целый раздел переключателей для получения дополнительной информации по остаткам. Например, указав опцию Остатки, наряду со стандартной таблицей регрессии будет выдана дополнительная таблица (табл. 5) следующего вида:

Таблица 5

ВЫВОД ОСТАТКА
Наблюдение Предсказанное Спрос y (тыс. шт.) Остатки
1 123,7511 1,426776
2 122,7896 1,019821
3 122,2914 –1,11646
4 120,6462 –3,7319
5 120,2544 –0,39014
6 119,6494 –1,5813
7 119,0288 4,559903
8 117,4316 –0,34387
9 117,2931 –1,12322
10 117,0864 1,257187
11 114,353 1,847847
12 114,1298 –2,67328
13 112,0989 3,003645
14 111,4176 –1,31194
15 110,8662 –0,84306

В данной таблице получены результаты предсказанных значений и значения остатков отдельно для каждого наблюдения. Указав опции График подбора, График остатков и График нормального распределения можно получить множество дополнительной информации и некоторые диаграммы.

Использование трех описанных нами инструментов исследования можно рассматривать как последовательные шаги в изучении парной регрессионной модели. При использовании статистических функций можно получить только уравнение регрессии и некоторый прогноз. Использование точечной диаграммы позволяет сразу увидеть уравнение регрессии, а также получить значение коэффициента детерминации. Точечная диаграмма может позволить и визуально оценить точность построенной модели. И, наконец, надстройка — Регрессия. Используя данный инструмент можно получить полную информацию относительно регрессионной модели. Данная таблица достаточно громоздкая, могут появиться затруднения с интерпретацией полученных результатов. Поэтому рекомендуется начинать исследование модели с использования статистических функций и линии тренда на точечной диаграмме.

Задания для самостоятельной работы

1. Для начальных данных, представленных в таблице 1, найти значение параметров регрессии между y и x1, используя функции дисперсии, ковариации и среднего.

2. Найдите коэффициент корреляции, а также полную информацию по регрессионной модели между значениями y и x1, y и x2, y и x3 (данные взять из таблицы для лабораторной работы № 1—8);

3. На основании полученной информации найти лучшую регрессионную модель, то есть ту переменную, которая в большей степени влияет на y (эта модель, в которой значение коэффициента детерминации максимально).

Лабораторная работа № 3

Свойства коэффициентов регрессии

Цель: научиться использовать метод Монте-Карло для получения стандартных отклонений и проверки выполнения условий Гаусса — Маркова.

Основные формулы и понятия

Условия Гаусса — Маркова для модели парной регрессии:

1) случайный член регрессии в каждом наблюдении имеет нулевое математическое ожидание

для любого i;

2) дисперсия случайного члена регрессии

не зависит от номера наблюдения i;

3) случайные члены регрессии в разных наблюдениях не зависят друг от друга, то есть

если i ¹ j;

4) случайный член регрессии и объясняющая переменная в каждом наблюдении независимы друг от друга, то есть

для любого i.

Если выполняются условия Гаусса — Маркова, то параметры регрессии, найденные методом наименьших квадратов, являются несмещёнными, состоятельными и эффективными оценками.

стандартное отклонение параметра b;

стандартное отклонение параметра a;

стандартная ошибка параметра b;

стандартная ошибка параметра a.

Электронная таблица Excel

В общем случае нет возможности проверить условия Гаусса — Маркова и вычислить стандартные отклонения. Поэтому рассмотрим возможности использования эксперимента по методу Монте-Карло. Простейший возможный эксперимент состоит из трех частей.

Во-первых, выбираются истинные значения a и b, и в каждом наблюдении выбирается значение x.

Во-вторых, в каждом наблюдении генерируется значение u, используя некоторый процесс генерации случайных чисел. При этом необходимо, чтобы выполнялись условия Гаусса — Маркова.

В-третьих, применяется регрессионный анализ для оценивания параметров a и b с использованием полученных значений y и x. При этом можно видеть, являются ли а и b хорошими оценками a и b.

На первых двух шагах проводится подготовка к применению регрессионного метода. Полностью контролируем модель, которую создаем. На третьем этапе определяем, может ли поставленная нами задача решаться с помощью метода регрессии, т. е. насколько близки оценки а и b к истинным значениям параметров a и b при использовании только данных о значениях у и x.

Произвольно положим a = 2 и b = 0,5, так что истинная зависимость имеет вид:

y = 2 + 0,5х + u

Предположим, что имеется 20 наблюдений и x принимает значения от 1 до 20. Для случайной остаточной составляющей u будем использовать случайные числа, взятые из нормально распределенной совокупности с нулевым средним и единичной дисперсией, следовательно,

и

. Нам потребуется набор из 20 значений. Таблица чисел, имеющих подобное распределение, может быть генерирована с помощью надстройки Генерация случайных чисел. При таком задании случайного воздействия u автоматически будут выполняться условия Гаусса — Маркова.

Зная значения x и u в каждом наблюдении, можно вычислить значения y, используя уравнение. Это сделано в таблице 6.

Таблица 6

X u y x u y
1 0,41 2,91 11 –0,89 6,61
2 –0,04 2,96 12 –0,49 7,51
3 1,22 4,72 13 1,29 9,79
4 1,22 5,22 14 –0,59 8,41
5 –1,25 3,25 15 –1,28 8,22
6 –0,54 4,46 16 –1,39 8,61
7 0,12 5,62 17 0,02 10,52
8 0,19 6,19 18 1,17 12,17
9 –1,7 4,8 19 1,12 12,62
10 0,05 7,05 20 0,56 12,56

Теперь при оценивании регрессионной зависимости у от x получим:

у = 1,95021 + 0,500932x.

В данном случае оценка а приняла меньшее значение по сравнению с a, а b немного выше по сравнению с b.

На основании данной таблицы можно просчитать среднее отклонение для коэффициентов регрессии. Для чего необходимо вычислить дисперсию x,

, и среднее значение из квадратов x,
. Тогда

,
,

,
.