Смекни!
smekni.com

Класична лінійна регресія (стр. 2 из 3)

де cjj – діагональний елемент j-ї строки (стовпця) матриці

,

- стандартна помилка оцінки j-го параметра моделі.

Якщо t³tтаб , нульова гіпотеза відхиляється і відповідний коефіцієнт регресії є достовірним.

18. На основі t-критерію і стандартної помилки будуються граничні інтервали для оцінок параметрів моделі:

де ta - табличне значення t-статистики з рівнем довіри a та ступенями свободи n-m.

ПРИКЛАД ВИКОНАННЯ ЛАБОРАТОРНОЇ РОБОТИ

Нехай маємо змінні:

- середньомісячна зарплата, ум. од.;

- продуктивність праці, ум. од.;

- фондомісткість продукції ум. од;

- виконання норми виробітку,%

Гіпотеза, що пропонується для перевірки - середньомісячна зарплата лінійно залежить від продуктивності праці, фондомісткості продукції та виконання норми виробітку.

Позначимо Y - середньомісячна зарплата, X1 - продуктивність праці, X2 - фондомісткість продукції, X3 - виконання норми виробітку/

Вихідні дані наведено в таблиці.

номер цеху середньомісячна з/п,Y Продуктивність праці, X1 ФондомісткістьX2 Норма виробітку, X3
1 45 265 0,2 130
2 42 236 0,04 127
3 50 257 0,3 151
4 55 279 0,2 149
5 40 226 0,1 140
6 70 350 0,1 141
7 56 278 0,25 152
8 57 262 0,03 188
9 55 269 0,15 120
10 53 250 0,32 126

Матриця Х доповнюється стовбцем одиниць для врахування коефіцієнта регресії b0:

1. Оцінимо параметри регресії за допомогою 1МНК.

Підготуємо необхідні проміжні матриці:


Використовуючи оператор оцінювання МНК, отримуємо

Þ Рівняння регресії має вигляд:

Y = -23,83+0,23X1+9,018X2+0,097X3

Ця модель має бути проаналізована на значущість в цілому (2), а також на значущість кожного коефіцієнта регресії зокрема (3).

2. Перевірка значущості моделі

Значущість всієї моделі в цілому будемо проводити для рівня значущості a=0,05 за допомогою F-крітерія при (m-1) і (n-m) ступенях свободи. Розрахункове значення F-критерію розраховується по формулі:

де

,

Y– спостеріганні значення фактора (вихідні дані),

n – число спостережень,

m – число оцінюваних параметрів.

Нульова гіпотеза для перевірки значущості моделі: Н0: b0 = b1 = …… = bm= 0.

Проведемо необхідні попередні розрахунки.

Використовуючи вихідну матрицю Х і побудовану модель, отримуємо розрахункові Yp:

Yp = X*BTі залишки е = Y - Yp :

Сума квадратів відхилень значень регресії від середнього та сума залишків дорівнює:

583,5752
,

Табличне значення для (m-1), (n-m) F-критерію (0,95) = 4,76. Оскільки Fp>Fтабл , модель можна вважати статистично значимою. (нульова гіпотеза відхиляється).

Далі оцінюєтья значущість кожного з параметрів bj.за допомогою t-статистики.


3. Оцінка значущості окремих коефіцієнтів регресії.

Гіпотезу про значущість кожного з параметрів bj економетрічної моделі можна виконати за допомогою t-крітерію. Нульова гіпотеза, найбільш поширена притестуванні економетричної моделі - bjнесуттєво відрізняються від 0, тобто H0: bj = 0. Поширеність такої постанови нульової гіпотези – в тому, що якщо вона підтверджується, то це має означати, що відповідний Xj статистично незначущо впливає на Y, його вплив з високою вірогідністю дорівнює 0, залежності між Y та Х практично немає і відповідна змінна повинна бути виключена з моделі. Виключенням є випадок, коли при незначущому bjзалежність між X і Y таки існує, але нелінійна. В цьому випадку треба змінити специфікацію моделі (надати їй іншу аналітичну форму).

Розрахункове значення t-критерію:

де Sbj – стандартна помилка коефіцієнта bj,

cjj – діагональний j-й елемент матриці С=

Визначимо значення стандартних помилок коефіцієнтів регресіїSbj як корінь з дисперсії коефіцієнта bj:

Для отримання оцінок дисперсії Dj розрахуємо дисперсійно-коваріаційну матрицю (іноді її називають коваріаційною).

Розраховується вона за формулою

,

де

- дисперсія залишків

Матрицю С=

ми маємо.

, де

n – кількість спостережень, n=10

m – кількість оцінюваних параметрів моделі, m=4.

Стандартне відхилення залишків

= 4,912352.

Отримуємо:

=

На діагоналі коваріаційної матриці отримуємо дисперсії коефіцієнтів регресіїbj:

D(b0) = 318,9421,

D(b1)=0,002358,

D(b2)=272,2121,

D(b3)=0,007489

Визначимо значення стандартних помилок коефіцієнтів регресіїSbj:


Sb0 =

= 17,85895,

Sb1 =

= 0,048839,

Sb2 =

= 16,49885,

Sb3 =

= 0,086537
17,85895
0,048839
16,49885
0,086537

Sb =

Розрахункове значення t-статистики отримуємо для кожного коефіцієнта:

tb0 = b0 / Sb0 = -23,83/ 17,85895 = -1,33433 і т. п.

-1,33433
4,658181
0,546609
1,121298

tp =

Розрахункові значення t-статистики порівнюються за абсолютною величиною з табличним t10-4 = 1,943. Параметр вважається статистично значимим (нульова гіпотеза не підтверджується), якщо

Це означає, що в нашому випадку тільки b1є статистично значущим і суттєво впливає на модель.

Довірчі інтервали для оцінок регресії будуються за формулою:



b0 =-23,8298±34,699
b1 =0,2275±0,0949
b2 =9,018423±32,0573
b3 =0,097034±0,1681

:

4. Якість побудованої моделі можна визначити за допомогою коефіцієнта детермінації:

,

Його значення показує, що на 85,8073% варіацію змінної Yможна пояснити варіацією пояснювальних змінних Х.

5. Тіснота зв’язку між Y і X для множинної регресії визначається за допомогою коефіцієнтів кореляції трьох типів:

- коефіцієнта множинної кореляції R (визначається як корінь з коефіцієнта детермінації) – показує тісноту зв’язку між Y і всією множиною пояснювальних зміннихX (1 на модель) ;

- парних коефіцієнтів кореляції r, що знаходяться в кореляційній матриці r* і характеризують тісноту зв’язку між Y та окремим Xj.Вони діляться на два типи:

а) парні коефіцієнти кореляції між Y та окремим Xj

б) парні коефіцієнти кореляції між окремими Xk і XjrXkXj(їх для моделі існує m*m);

- частинних коефіцієнтів кореляції, що також характеризують тісноту зв’язку між Y та окремим Xj, але при умові, що інші незалежні змінні сталі, тобто їх варіація не впливає на залежність між Y та Х:


де Rkj – алгебраїчне доповнення до (j,k)-го елемента кореляційної матриці r;