Рассмотрим раздел дисперсионный анализ. В столбце SS выдаются все виды сумм квадратов отклонений. В данном случае в первой строке, которая соответствует надписи Регрессия, выдается объясненная сумма квадратов отклонений RSS, во второй строке — Остаток — выдается необъясненная (остаточная) сумма квадратов отклонений ESS, в третьей строке — Итого — выдается общая сумма квадратов отклонений TSS.
В последнем разделе, который не имеет названия, будет интерпретироваться как раздел — коэффициенты, содержится полная информация по коэффициентам. Рассмотрим значения, полученные в столбце Коэффициенты. Пункт Y-пересечение выдает значение коэффициента a. Пункт Цена x (р.) выдает значение коэффициента b.
Представленные в таблице значения полностью совпадают с данными, полученными посредством статистических функций и линий тренда на точечной диаграмме.
В диалоговом окне Регрессия имеется целый раздел переключателей для получения дополнительной информации по остаткам. Например, указав опцию Остатки, наряду со стандартной таблицей регрессии будет выдана дополнительная таблица (табл. 5) следующего вида:
Таблица 5
ВЫВОД ОСТАТКА | ||
Наблюдение | Предсказанное Спрос y (тыс. шт.) | Остатки |
1 | 123,7511 | 1,426776 |
2 | 122,7896 | 1,019821 |
3 | 122,2914 | –1,11646 |
4 | 120,6462 | –3,7319 |
5 | 120,2544 | –0,39014 |
6 | 119,6494 | –1,5813 |
7 | 119,0288 | 4,559903 |
8 | 117,4316 | –0,34387 |
9 | 117,2931 | –1,12322 |
10 | 117,0864 | 1,257187 |
11 | 114,353 | 1,847847 |
12 | 114,1298 | –2,67328 |
13 | 112,0989 | 3,003645 |
14 | 111,4176 | –1,31194 |
15 | 110,8662 | –0,84306 |
В данной таблице получены результаты предсказанных значений и значения остатков отдельно для каждого наблюдения. Указав опции График подбора, График остатков и График нормального распределения можно получить множество дополнительной информации и некоторые диаграммы.
Использование трех описанных нами инструментов исследования можно рассматривать как последовательные шаги в изучении парной регрессионной модели. При использовании статистических функций можно получить только уравнение регрессии и некоторый прогноз. Использование точечной диаграммы позволяет сразу увидеть уравнение регрессии, а также получить значение коэффициента детерминации. Точечная диаграмма может позволить и визуально оценить точность построенной модели. И, наконец, надстройка — Регрессия. Используя данный инструмент можно получить полную информацию относительно регрессионной модели. Данная таблица достаточно громоздкая, могут появиться затруднения с интерпретацией полученных результатов. Поэтому рекомендуется начинать исследование модели с использования статистических функций и линии тренда на точечной диаграмме.
Задания для самостоятельной работы
1. Для начальных данных, представленных в таблице 1, найти значение параметров регрессии между y и x1, используя функции дисперсии, ковариации и среднего.
2. Найдите коэффициент корреляции, а также полную информацию по регрессионной модели между значениями y и x1, y и x2, y и x3 (данные взять из таблицы для лабораторной работы № 1—8);
3. На основании полученной информации найти лучшую регрессионную модель, то есть ту переменную, которая в большей степени влияет на y (эта модель, в которой значение коэффициента детерминации максимально).
Свойства коэффициентов регрессии
Цель: научиться использовать метод Монте-Карло для получения стандартных отклонений и проверки выполнения условий Гаусса — Маркова.
Основные формулы и понятия
Условия Гаусса — Маркова для модели парной регрессии:
1) случайный член регрессии в каждом наблюдении имеет нулевое математическое ожидание для любого i;
2) дисперсия случайного члена регрессии не зависит от номера наблюдения i;
3) случайные члены регрессии в разных наблюдениях не зависят друг от друга, то есть если i ¹ j;
4) случайный член регрессии и объясняющая переменная в каждом наблюдении независимы друг от друга, то есть для любого i.
Если выполняются условия Гаусса — Маркова, то параметры регрессии, найденные методом наименьших квадратов, являются несмещёнными, состоятельными и эффективными оценками.
— стандартное отклонение параметра b; — стандартное отклонение параметра a;— стандартная ошибка параметра b;
— стандартная ошибка параметра a.
Электронная таблица Excel
В общем случае нет возможности проверить условия Гаусса — Маркова и вычислить стандартные отклонения. Поэтому рассмотрим возможности использования эксперимента по методу Монте-Карло. Простейший возможный эксперимент состоит из трех частей.
Во-первых, выбираются истинные значения a и b, и в каждом наблюдении выбирается значение x.
Во-вторых, в каждом наблюдении генерируется значение u, используя некоторый процесс генерации случайных чисел. При этом необходимо, чтобы выполнялись условия Гаусса — Маркова.
В-третьих, применяется регрессионный анализ для оценивания параметров a и b с использованием полученных значений y и x. При этом можно видеть, являются ли а и b хорошими оценками a и b.
На первых двух шагах проводится подготовка к применению регрессионного метода. Полностью контролируем модель, которую создаем. На третьем этапе определяем, может ли поставленная нами задача решаться с помощью метода регрессии, т. е. насколько близки оценки а и b к истинным значениям параметров a и b при использовании только данных о значениях у и x.
Произвольно положим a = 2 и b = 0,5, так что истинная зависимость имеет вид:
y = 2 + 0,5х + u
Предположим, что имеется 20 наблюдений и x принимает значения от 1 до 20. Для случайной остаточной составляющей u будем использовать случайные числа, взятые из нормально распределенной совокупности с нулевым средним и единичной дисперсией, следовательно, и
. Нам потребуется набор из 20 значений. Таблица чисел, имеющих подобное распределение, может быть генерирована с помощью надстройки Генерация случайных чисел. При таком задании случайного воздействия u автоматически будут выполняться условия Гаусса — Маркова.Зная значения x и u в каждом наблюдении, можно вычислить значения y, используя уравнение. Это сделано в таблице 6.
Таблица 6
X | u | y | x | u | y |
1 | 0,41 | 2,91 | 11 | –0,89 | 6,61 |
2 | –0,04 | 2,96 | 12 | –0,49 | 7,51 |
3 | 1,22 | 4,72 | 13 | 1,29 | 9,79 |
4 | 1,22 | 5,22 | 14 | –0,59 | 8,41 |
5 | –1,25 | 3,25 | 15 | –1,28 | 8,22 |
6 | –0,54 | 4,46 | 16 | –1,39 | 8,61 |
7 | 0,12 | 5,62 | 17 | 0,02 | 10,52 |
8 | 0,19 | 6,19 | 18 | 1,17 | 12,17 |
9 | –1,7 | 4,8 | 19 | 1,12 | 12,62 |
10 | 0,05 | 7,05 | 20 | 0,56 | 12,56 |
Теперь при оценивании регрессионной зависимости у от x получим:
у = 1,95021 + 0,500932x.
В данном случае оценка а приняла меньшее значение по сравнению с a, а b немного выше по сравнению с b.
На основании данной таблицы можно просчитать среднее отклонение для коэффициентов регрессии. Для чего необходимо вычислить дисперсию x,
, и среднее значение из квадратов x, . Тогда , , , .