По статистическим таблицам F-распределения F0,05;1;26 = 4,22. Так как
F > F0,05;1;26, то уравнение регрессии значимо.
2-й способ. Учитывая, что b1 = 0,739,
= 11170,43t =
= 16,17.По таблице t-распределения t0,95;26 = 2,06. Так как t > t0,95;26, то коэффициент регрессии b1, а значит, и уравнение парной линейной регрессии значимо.
Найдем коэффициент детерминации и поясним его смысл. Ранее было получено QR = 6108,09, Q = 6715,71. По формуле (28)
= 0,9095 (или R2 = r2 = 0,9542 = 0,9095). Это означает, что изменения зависимой переменной у – дневная выработка – на 90% объясняется вариацией объясняющей переменной х – уровнем механизации.Найдем 95%-ные доверительные интервалы для индивидуального значения прибыли при уровне механизации равной 65%.
Ранее было получено уравнение регрессии
= -19,37 + 0,74x.Чтобы построить доверительный интервал для индивидуального значения
, найдем точечное значение признака = -19,37 + 0,74∙65 = 28,718.Затем найдем дисперсию оценки:
=23,370 = 0,839и
= 0,916.Далее искомый доверительный интервал получим по (29):
28,718 – 2,06∙0,916 £
£ 28,718 + 2,06∙0,91626,832 £
£ 30,604Таким образом, дневная выработка при уровне механизации равной 65% с надежностью 0,95 находится в пределах от 26,832 ед. до
30,604 ед.
Найдем 95%-ный доверительный интервал для параметра b1.
По формуле (30)
0,74 – 2,06
£b1£ 0,74 + 2,06 ,0,645 £b1£ 0,834,
т.е. с надежностью 0,95 при изменении уровня механизации x на 1% дневная выработка y будет изменяться на величину, заключенную в интервале от 0,645 до 0,834 (ед.).
Исследуем полученную модель на наличие гетероскедастичности.
Тест Голфреда-Квандта.
Упорядочим п наблюдений по мере возрастания переменной х. Исключим из рассмотрения С = 6 центральных наблюдений (условие
(п-С)/2 = (28 – 6)/2 = 11 > р = 1 выполняется). Разделим совокупность из (п-С) = (28 – 6) = 22 наблюдений на две группы (соответственно с малыми и большими значениями фактора х по 11 наблюдений) и определим по каждой из групп уравнения регрессии. Для первой группы оно составит
N | X | Y | Yрег = -3,70 + 0,39Х | e=Y-Yрег | e^2 |
1 | 15 | 5 | 2,15 | 2,85 | 8,1225 |
2 | 24 | 6 | 5,66 | 0,34 | 0,1156 |
3 | 42 | 6 | 12,68 | -6,68 | 44,6224 |
4 | 46 | 9 | 14,24 | -5,24 | 27,4576 |
5 | 48 | 15 | 15,02 | -0,02 | 0,0004 |
6 | 48 | 14 | 15,02 | -1,02 | 1,0404 |
7 | 50 | 17 | 15,8 | 1,2 | 1,44 |
8 | 52 | 17 | 16,58 | 0,42 | 0,1764 |
9 | 53 | 22 | 16,97 | 5,03 | 25,3009 |
10 | 54 | 21 | 17,36 | 3,64 | 13,2496 |
S1 | 121,5258 | ||||
N | X | Y | Yрег = -53,11 + 1,16Х | e=Y-Yрег | e^2 |
17 | 66 | 25 | 23,45 | 1,55 | 2,4025 |
18 | 70 | 27 | 28,09 | -1,09 | 1,1881 |
19 | 72 | 31 | 30,41 | 0,59 | 0,3481 |
20 | 75 | 33 | 33,89 | -0,89 | 0,7921 |
21 | 76 | 33 | 35,05 | -2,05 | 4,2025 |
22 | 80 | 42 | 39,69 | 2,31 | 5,3361 |
23 | 82 | 41 | 42,01 | -1,01 | 1,0201 |
24 | 87 | 44 | 47,81 | -3,81 | 14,5161 |
25 | 90 | 53 | 51,29 | 1,71 | 2,9241 |
26 | 93 | 55 | 54,77 | 0,23 | 0,0529 |
27 | 95 | 57 | 57,09 | -0,09 | 0,0081 |
28 | 99 | 62 | 61,73 | 0,27 | 0,0729 |
S2 | 32,8636 |
Тест ранговой корреляции Спирмэна
Проранжируем значения хi и абсолютные величины остатков в порядке возрастания, расчеты занесем в табл. 6.
Найдем коэффициент ранговой корреляции Спирмэна:
= 0,108.Таблица 6
N | X | Ei | Расчет ранговой корреляции | |||
Ранг Х | Ранг |Ei| | d | d^2 | |||
1 | 15 | 13,27 | 1 | 28 | -27 | 729 |
2 | 24 | 7,61 | 2 | 26 | -24 | 576 |
3 | 42 | -5,71 | 3 | 23 | -20 | 400 |
4 | 46 | -5,67 | 4 | 22 | -18 | 324 |
5 | 48 | -1,15 | 5 | 6 | -1 | 1 |
6 | 48 | -2,15 | 6 | 9 | -3 | 9 |
7 | 50 | -0,63 | 7 | 3 | 4 | 16 |
8 | 52 | -2,11 | 8 | 8 | 0 | 0 |
9 | 53 | 2,15 | 9 | 10 | -1 | 1 |
10 | 54 | 0,41 | 10 | 2 | 8 | 64 |
11 | 55 | 0,67 | 11 | 4 | 7 | 49 |
12 | 60 | -2,03 | 12 | 7 | 5 | 25 |
13 | 61 | -2,77 | 13 | 13 | 0 | 0 |
14 | 62 | -2,51 | 14 | 12 | 2 | 4 |
15 | 63 | -3,25 | 15 | 17 | -2 | 4 |
16 | 64 | -2,99 | 16 | 15 | 1 | 1 |
17 | 66 | -4,47 | 17 | 19 | -2 | 4 |
18 | 70 | -5,43 | 18 | 20 | -2 | 4 |
19 | 72 | -2,91 | 19 | 14 | 5 | 25 |
20 | 75 | -3,13 | 20 | 16 | 4 | 16 |
21 | 76 | -3,87 | 21 | 18 | 3 | 9 |
22 | 80 | 2,17 | 22 | 11 | 11 | 121 |
23 | 82 | -0,31 | 23 | 1 | 22 | 484 |
24 | 87 | -1,01 | 24 | 5 | 19 | 361 |
25 | 90 | 5,77 | 25 | 24 | 1 | 1 |
26 | 93 | 5,55 | 26 | 21 | 5 | 25 |
27 | 95 | 6,07 | 27 | 25 | 2 | 4 |
28 | 99 | 8,11 | 28 | 27 | 1 | 1 |
Сумма | 0,00 | 3258 |
Найдем t-критерий для ранговой корреляции:
= 0,556.Сравним полученное значение tr с табличным значением
t0,95; 26 = 2,06. Так как tr < t0,95; 26, то на уровне значимости 5% принимается гипотеза об отсутствии гетероскедастичности.
Использование теста Уайта рассмотрим во второй части методических указаний.
Тест Парка Тест предполагает, что дисперсия остатков связана со значениями факторов функций ln e2 = а + blnх + и. Проверяется значимость коэффициента регрессии b по t-критерию Стьюдента. Если коэффициент регрессии для уравнения lne2 окажется статистически значимым, то, следовательно, существует зависимость lne2 от lnх, т.е. имеет место гетероскедастичность остатков.
Чтобы построить зависимость ln e2 = а + blnх введем замены:
ln e2 = у, lnх = z. Построим линейную регрессию у = а + bz. Для этого воспользуемся пакетом анализа MicrosoftExcel (Сервис + Анализ данных + + Регрессия). В результате получим следующую модель:
ln e2 = 5,635 - 0,901 lnх.
Проверка уравнения на значимость показывает: R2 = 0,039; F = 1,056; ta = 1,565 и tb = 1,028. По тесту Парка зависимость дисперсии остатков от х проявляется ненадежно: все параметры статистически нее значимы, R2 очень низкий, t-критерий и F-статистика меньше табличных значений (t0,95;26 = 2,06; F0,05;1;26 = 4,23). Тест Парка показал отсутствие гетероскедастичности.
Тест Гейзера
Тест оценивает зависимость абсолютных значений остатков от значений фактора х в виде функции: |e| = a + b ∙ xc, где с задается определенным числом степени. Для нашего примера используем значения с равные -2;-1; -0,5; 0,5; 1;2.
Для построения моделей регрессий воспользуемся пакетом анализа Microsoft Excel. Получили следующие результаты:
при с = -2 |e| = 2,62 + 2327,52x-2R2 = 0,460; F = 22,14
(5,61) (4,71)
при с = -1 |e| = 0,87 + 153,09x-1R2 = 0,360; F = 14,61
(1,01) (3,82)
при с = -0,5 |e| = -2,40 + 46,10x-0,5R2 = 0,271; F = 9,65
(1,19) (3,11)
при с = 0,5 |e| = 8,58 - 0,62x0,5R2 = 0,090; F = 2,56
(2,76) (1,60)
при с = 1 |e| = 5,39 - 0,03xR2 = 0,035; F = 0,945
(2,97) (0,97)
Из теста Гейзера следует, что абсолютная величина остатков достаточно сильно зависит от х-2.