Смекни!
smekni.com

Линейная парная регрессия (стр. 4 из 4)

По статистическим таблицам F-распределения F0,05;1;26 = 4,22. Так как
F > F0,05;1;26, то уравнение регрессии значимо.

2-й способ. Учитывая, что b1 = 0,739,

= 11170,43
(табл. 4),
=
=23,37 (табл. 4), по формуле (26)

t =

= 16,17.

По таблице t-распределения t0,95;26 = 2,06. Так как t > t0,95;26, то коэффициент регрессии b1, а значит, и уравнение парной линейной регрессии значимо.

Найдем коэффициент детерминации и поясним его смысл. Ранее было получено QR = 6108,09, Q = 6715,71. По формуле (28)

= 0,9095 (или R2 = r2 = 0,9542 = 0,9095). Это означает, что изменения зависимой переменной у – дневная выработка – на 90% объясняется вариацией объясняющей переменной х – уровнем механизации.

Найдем 95%-ные доверительные интервалы для индивидуального значения прибыли при уровне механизации равной 65%.

Ранее было получено уравнение регрессии

= -19,37 + 0,74x.

Чтобы построить доверительный интервал для индивидуального значения

, найдем точечное значение признака
= -19,37 + 0,74∙65 = 28,718.

Затем найдем дисперсию оценки:

=23,370
= 0,839

и

= 0,916.

Далее искомый доверительный интервал получим по (29):

28,718 – 2,06∙0,916 £

£ 28,718 + 2,06∙0,916

26,832 £

£ 30,604

Таким образом, дневная выработка при уровне механизации равной 65% с надежностью 0,95 находится в пределах от 26,832 ед. до
30,604 ед.

Найдем 95%-ный доверительный интервал для параметра b1.

По формуле (30)

0,74 – 2,06

£b1£ 0,74 + 2,06
,

0,645 £b1£ 0,834,

т.е. с надежностью 0,95 при изменении уровня механизации x на 1% дневная выработка y будет изменяться на величину, заключенную в интервале от 0,645 до 0,834 (ед.).

Исследуем полученную модель на наличие гетероскедастичности.

Тест Голфреда-Квандта.

Упорядочим п наблюдений по мере возрастания переменной х. Исключим из рассмотрения С = 6 центральных наблюдений (условие
(п-С)/2 = (28 – 6)/2 = 11 > р = 1 выполняется). Разделим совокупность из (п-С) = (28 – 6) = 22 наблюдений на две группы (соответственно с малыми и большими значениями фактора х по 11 наблюдений) и определим по каждой из групп уравнения регрессии. Для первой группы оно составит

= -3,70 + 0,39x. Для второй группы:
= 1,16 + 53,11x. Определим остаточные суммы квадратов для первой (S1) и второй (S2) групп. Промежуточные расчеты занесем в табл. 5.
N X Y Yрег = -3,70 + 0,39Х e=Y-Yрег e^2
1 15 5 2,15 2,85 8,1225
2 24 6 5,66 0,34 0,1156
3 42 6 12,68 -6,68 44,6224
4 46 9 14,24 -5,24 27,4576
5 48 15 15,02 -0,02 0,0004
6 48 14 15,02 -1,02 1,0404
7 50 17 15,8 1,2 1,44
8 52 17 16,58 0,42 0,1764
9 53 22 16,97 5,03 25,3009
10 54 21 17,36 3,64 13,2496
S1 121,5258
N X Y Yрег = -53,11 + 1,16Х e=Y-Yрег e^2
17 66 25 23,45 1,55 2,4025
18 70 27 28,09 -1,09 1,1881
19 72 31 30,41 0,59 0,3481
20 75 33 33,89 -0,89 0,7921
21 76 33 35,05 -2,05 4,2025
22 80 42 39,69 2,31 5,3361
23 82 41 42,01 -1,01 1,0201
24 87 44 47,81 -3,81 14,5161
25 90 53 51,29 1,71 2,9241
26 93 55 54,77 0,23 0,0529
27 95 57 57,09 -0,09 0,0081
28 99 62 61,73 0,27 0,0729
S2 32,8636

Тест ранговой корреляции Спирмэна

Проранжируем значения хi и абсолютные величины остатков в порядке возрастания, расчеты занесем в табл. 6.

Найдем коэффициент ранговой корреляции Спирмэна:

= 0,108.

Таблица 6

N X Ei Расчет ранговой корреляции
Ранг Х Ранг |Ei| d d^2
1 15 13,27 1 28 -27 729
2 24 7,61 2 26 -24 576
3 42 -5,71 3 23 -20 400
4 46 -5,67 4 22 -18 324
5 48 -1,15 5 6 -1 1
6 48 -2,15 6 9 -3 9
7 50 -0,63 7 3 4 16
8 52 -2,11 8 8 0 0
9 53 2,15 9 10 -1 1
10 54 0,41 10 2 8 64
11 55 0,67 11 4 7 49
12 60 -2,03 12 7 5 25
13 61 -2,77 13 13 0 0
14 62 -2,51 14 12 2 4
15 63 -3,25 15 17 -2 4
16 64 -2,99 16 15 1 1
17 66 -4,47 17 19 -2 4
18 70 -5,43 18 20 -2 4
19 72 -2,91 19 14 5 25
20 75 -3,13 20 16 4 16
21 76 -3,87 21 18 3 9
22 80 2,17 22 11 11 121
23 82 -0,31 23 1 22 484
24 87 -1,01 24 5 19 361
25 90 5,77 25 24 1 1
26 93 5,55 26 21 5 25
27 95 6,07 27 25 2 4
28 99 8,11 28 27 1 1
Сумма 0,00 3258

Найдем t-критерий для ранговой корреляции:

= 0,556.

Сравним полученное значение tr с табличным значением
t0,95; 26 = 2,06. Так как tr < t0,95; 26, то на уровне значимости 5% принимается гипотеза об отсутствии гетероскедастичности.

Использование теста Уайта рассмотрим во второй части методических указаний.

Тест Парка Тест предполагает, что дисперсия остатков связана со значениями факторов функций ln e2 = а + blnх + и. Проверяется значимость коэффициента регрессии b по t-критерию Стьюдента. Если коэффициент регрессии для уравнения lne2 окажется статистически значимым, то, следовательно, существует зависимость lne2 от lnх, т.е. имеет место гетероскедастичность остатков.

Чтобы построить зависимость ln e2 = а + blnх введем замены:
ln e2 = у, lnх = z. Построим линейную регрессию у = а + bz. Для этого воспользуемся пакетом анализа MicrosoftExcel (Сервис + Анализ данных + + Регрессия). В результате получим следующую модель:

ln e2 = 5,635 - 0,901 lnх.

Проверка уравнения на значимость показывает: R2 = 0,039; F = 1,056; ta = 1,565 и tb = 1,028. По тесту Парка зависимость дисперсии остатков от х проявляется ненадежно: все параметры статистически нее значимы, R2 очень низкий, t-критерий и F-статистика меньше табличных значений (t0,95;26 = 2,06; F0,05;1;26 = 4,23). Тест Парка показал отсутствие гетероскедастичности.

Тест Гейзера

Тест оценивает зависимость абсолютных значений остатков от значений фактора х в виде функции: |e| = a + bxc, где с задается определенным числом степени. Для нашего примера используем значения с равные -2;-1; -0,5; 0,5; 1;2.

Для построения моделей регрессий воспользуемся пакетом анализа Microsoft Excel. Получили следующие результаты:

при с = -2 |e| = 2,62 + 2327,52x-2R2 = 0,460; F = 22,14

(5,61) (4,71)

при с = -1 |e| = 0,87 + 153,09x-1R2 = 0,360; F = 14,61

(1,01) (3,82)

при с = -0,5 |e| = -2,40 + 46,10x-0,5R2 = 0,271; F = 9,65

(1,19) (3,11)

при с = 0,5 |e| = 8,58 - 0,62x0,5R2 = 0,090; F = 2,56

(2,76) (1,60)

при с = 1 |e| = 5,39 - 0,03xR2 = 0,035; F = 0,945

(2,97) (0,97)

Из теста Гейзера следует, что абсолютная величина остатков достаточно сильно зависит от х-2.