Вычислить стандартные отклонения мы смогли только потому, что заранее задали все параметры модели, в частности, дисперсию случайного члена
. В реальных моделях данный параметр неизвестен, поэтому необходимо воспользоваться несмещённой оценкой данного параметра .После того, как вычислили стандартные отклонения, можно вычислять стандартные ошибки. Однако для этого понадобятся дисперсия остатков, для чего используя соответствующую надстройку, получим значения остатков. Возможность нахождения остатков нами была рассмотрена ранее.
В данном случае дисперсия остатков будет
, тогда . Полученное значение оценки немного превышает значение , которое мы положили равным единице, следовательно, все значения будут несколько превышать теоретические. Стандартные ошибки будут:,
,,
.Очевидно, что одного эксперимента такого типа едва ли достаточно для оценки качества метода регрессии. Он дал довольно хорошие результаты, но возможно это лишь счастливый случай. Для дальнейшей проверки повторим эксперимент с тем же истинным уравнением и с теми же значениями x, но с новым набором случайных чисел для остаточного члена, взятых из того же распределения. Используя эти значения u и значения x, получим новый набор значений у. Результаты оценивания регрессии между новыми значениями у и x, при различных наборах случайных величин u, представлены в таблице 7.
Таблица 7
Эксперимент | а | b |
1 | 1,63 | 0,54 |
2 | 2,52 | 0,48 |
3 | 2,13 | 0,45 |
4 | 2,14 | 0,50 |
5 | 1,71 | 0,56 |
6 | 1,81 | 0,51 |
7 | 1,72 | 0,56 |
8 | 3,18 | 0,41 |
9 | 1,26 | 0,58 |
10 | 1,94 | 0,52 |
Можно заметить, что в одних случаях оценки принимают заниженные значения, а в других завышенные, однако, в целом значения а и b группируются вокруг истинных значений a и b, равных соответственно 2,00 и 0,50.
При очень большом числе повторений эксперимента можно построить таблицу частот для b и получить аппроксимацию функции плотности вероятности. Это нормальное распределение со средним 0,50 и стандартным отклонением 0,0388.
До сих пор вся работа выполнялась с помощью стандартных функций, однако большая часть информации может быть получена, если использовать надстройку Регрессия. Данная таблица уже рассматривалась нами ранее, но была разобрана только небольшая её часть. Выведем результаты работы надстройки Регрессии для данных из таблицы 6.
В этом случае получим итоговую таблицу 8.
Таблица 8
ВЫВОД ИТОГОВ | ||||||
Регрессионная статистика | ||||||
Множественный R | 0,951453 | |||||
R-квадрат | 0,905263 | |||||
Нормированный R-квадрат | 0,9 | |||||
Стандартная ошибка | 0,984977 | |||||
Наблюдения | 20 | |||||
Дисперсионный анализ | ||||||
| df | SS | MS | F | Значимость F | |
Регрессия | 1 | 166,8706 | 166,8706 | 171,9998 | 1,19E-10 | |
Остаток | 18 | 17,46322 | 0,970179 | |||
Итого | 19 | 184,3338 | ||||
| Коэффи циенты | Стандартная ошибка | t-статистика | P- значение | Нижние 95 % | Верхние 95 % |
Y-пересечение | 1,950211 | 0,457553 | 4,262265 | 0,000469 | 0,988927 | 2,91149 |
X | 0,500932 | 0,038196 | 13,11487 | 1,19E-10 | 0,420686 | 0,58117 |
В соответствующем столбце итоговой таблице имеются значения стандартных ошибок, которые полностью совпадают со значениями, полученными ранее, используя вычисления на основании исходных формул.
Задания для самостоятельной работы
1. Проведите подобные исследования, а именно получите стандартные ошибки параметров a и b в случае когда:
a) среднеквадратичное отклонение случайного члена регрессии u имеет удвоенное значение, т. е.
;b) имеется в два раза больше наблюдений n = 40, при этом разность между соседними значениями x равна 0,5;
c) имеется 20 наблюдений, но расстояние между значениями x в два раза больше.
2. Проведите подобные исследования, взяв в качестве случайного члена регрессии u случайную величину, имеющую равномерное распределение на отрезке от –5 до 5. Чему в данном случае будет равна дисперсия u?
3. Будут ли нарушены условия Гаусса — Маркова, если случайная составляющая имеет:
a) равномерное распределение с параметрами между 1 и 10;
b) равномерное распределение с параметрами между –4 и 4;
c) равномерное распределение с параметрами между –2 и 4;
d) Пуассоновское распределение с параметром 2;
нормальное распределение с параметрами 0 и 10.
Цель: изучить возможности вычисления значений функций для нормального распределения, а также распределения Стьюдента и Фишера.
Основные формулы и понятия:
— стандартная нормально распределенная случайная величина; — плотность распределения; — функция распределения; — нормально распределенная случайная величина; — плотность нормального распределения; — функция нормального распределения; — односторонняя критическая точка с уровнем a : ; — двусторонняя критическая точка с уровнем a : .Пусть случайная величина X имеет нормальное распределение, тогда случайная величина Y=ex называется логарифмически нормальной. Можно показать, что плотность распределения этой величины определяется формулой
Пусть Х0,Х1,Х2,... ,Xn имеют одно и то же нормальное распределение с параметрами m,s , тогда величина
— имеет распределение хи-квадрат; — имеет распределение Стьюдента; — односторонняя критическая точка с уровнем a, ; — двусторонняя критическая точек с уровнем a: ,где n — число степеней свободы;
— распределение Фишера с k1 и k2 степенями свободы;