де cjj – діагональний елемент j-ї строки (стовпця) матриці
, - стандартна помилка оцінки j-го параметра моделі.Якщо t³tтаб , нульова гіпотеза відхиляється і відповідний коефіцієнт регресії є достовірним.
18. На основі t-критерію і стандартної помилки будуються граничні інтервали для оцінок параметрів моделі:
де ta - табличне значення t-статистики з рівнем довіри a та ступенями свободи n-m.
ПРИКЛАД ВИКОНАННЯ ЛАБОРАТОРНОЇ РОБОТИ
Нехай маємо змінні:
- середньомісячна зарплата, ум. од.;
- продуктивність праці, ум. од.;
- фондомісткість продукції ум. од;
- виконання норми виробітку,%
Гіпотеза, що пропонується для перевірки - середньомісячна зарплата лінійно залежить від продуктивності праці, фондомісткості продукції та виконання норми виробітку.
Позначимо Y - середньомісячна зарплата, X1 - продуктивність праці, X2 - фондомісткість продукції, X3 - виконання норми виробітку/
Вихідні дані наведено в таблиці.
номер цеху | середньомісячна з/п,Y | Продуктивність праці, X1 | ФондомісткістьX2 | Норма виробітку, X3 |
1 | 45 | 265 | 0,2 | 130 |
2 | 42 | 236 | 0,04 | 127 |
3 | 50 | 257 | 0,3 | 151 |
4 | 55 | 279 | 0,2 | 149 |
5 | 40 | 226 | 0,1 | 140 |
6 | 70 | 350 | 0,1 | 141 |
7 | 56 | 278 | 0,25 | 152 |
8 | 57 | 262 | 0,03 | 188 |
9 | 55 | 269 | 0,15 | 120 |
10 | 53 | 250 | 0,32 | 126 |
Матриця Х доповнюється стовбцем одиниць для врахування коефіцієнта регресії b0:
1. Оцінимо параметри регресії за допомогою 1МНК.
Підготуємо необхідні проміжні матриці:
Використовуючи оператор оцінювання МНК, отримуємо
Þ Рівняння регресії має вигляд:
Y = -23,83+0,23X1+9,018X2+0,097X3
Ця модель має бути проаналізована на значущість в цілому (2), а також на значущість кожного коефіцієнта регресії зокрема (3).
2. Перевірка значущості моделі
Значущість всієї моделі в цілому будемо проводити для рівня значущості a=0,05 за допомогою F-крітерія при (m-1) і (n-m) ступенях свободи. Розрахункове значення F-критерію розраховується по формулі:
де
,Y– спостеріганні значення фактора (вихідні дані),
n – число спостережень,
m – число оцінюваних параметрів.
Нульова гіпотеза для перевірки значущості моделі: Н0: b0 = b1 = …… = bm= 0.
Проведемо необхідні попередні розрахунки.
Використовуючи вихідну матрицю Х і побудовану модель, отримуємо розрахункові Yp:
Yp = X*BTі залишки е = Y - Yp :
Сума квадратів відхилень значень регресії від середнього та сума залишків дорівнює:
583,5752 ,Табличне значення для (m-1), (n-m) F-критерію (0,95) = 4,76. Оскільки Fp>Fтабл , модель можна вважати статистично значимою. (нульова гіпотеза відхиляється).
Далі оцінюєтья значущість кожного з параметрів bj.за допомогою t-статистики.
3. Оцінка значущості окремих коефіцієнтів регресії.
Гіпотезу про значущість кожного з параметрів bj економетрічної моделі можна виконати за допомогою t-крітерію. Нульова гіпотеза, найбільш поширена притестуванні економетричної моделі - bjнесуттєво відрізняються від 0, тобто H0: bj = 0. Поширеність такої постанови нульової гіпотези – в тому, що якщо вона підтверджується, то це має означати, що відповідний Xj статистично незначущо впливає на Y, його вплив з високою вірогідністю дорівнює 0, залежності між Y та Х практично немає і відповідна змінна повинна бути виключена з моделі. Виключенням є випадок, коли при незначущому bjзалежність між X і Y таки існує, але нелінійна. В цьому випадку треба змінити специфікацію моделі (надати їй іншу аналітичну форму).
Розрахункове значення t-критерію:
де Sbj – стандартна помилка коефіцієнта bj,
cjj – діагональний j-й елемент матриці С=
Визначимо значення стандартних помилок коефіцієнтів регресіїSbj як корінь з дисперсії коефіцієнта bj:
Для отримання оцінок дисперсії Dj розрахуємо дисперсійно-коваріаційну матрицю (іноді її називають коваріаційною).
Розраховується вона за формулою
,де
- дисперсія залишківМатрицю С=
ми маємо. , деn – кількість спостережень, n=10
m – кількість оцінюваних параметрів моделі, m=4.
Стандартне відхилення залишків
= 4,912352.Отримуємо:
=На діагоналі коваріаційної матриці отримуємо дисперсії коефіцієнтів регресіїbj:
D(b0) = 318,9421,
D(b1)=0,002358,
D(b2)=272,2121,
D(b3)=0,007489
Визначимо значення стандартних помилок коефіцієнтів регресіїSbj:
Sb0 =
= 17,85895,Sb1 =
= 0,048839,Sb2 =
= 16,49885,Sb3 =
= 0,08653717,85895 |
0,048839 |
16,49885 |
0,086537 |
Sb =
Розрахункове значення t-статистики отримуємо для кожного коефіцієнта:
tb0 = b0 / Sb0 = -23,83/ 17,85895 = -1,33433 і т. п.
-1,33433 |
4,658181 |
0,546609 |
1,121298 |
tp =
Розрахункові значення t-статистики порівнюються за абсолютною величиною з табличним t10-4 = 1,943. Параметр вважається статистично значимим (нульова гіпотеза не підтверджується), якщо
Це означає, що в нашому випадку тільки b1є статистично значущим і суттєво впливає на модель.
Довірчі інтервали для оцінок регресії будуються за формулою:
b0 =-23,8298±34,699 |
b1 =0,2275±0,0949 |
b2 =9,018423±32,0573 |
b3 =0,097034±0,1681 |
4. Якість побудованої моделі можна визначити за допомогою коефіцієнта детермінації:
,Його значення показує, що на 85,8073% варіацію змінної Yможна пояснити варіацією пояснювальних змінних Х.
5. Тіснота зв’язку між Y і X для множинної регресії визначається за допомогою коефіцієнтів кореляції трьох типів:
- коефіцієнта множинної кореляції R (визначається як корінь з коефіцієнта детермінації) – показує тісноту зв’язку між Y і всією множиною пояснювальних зміннихX (1 на модель) ;
- парних коефіцієнтів кореляції r, що знаходяться в кореляційній матриці r* і характеризують тісноту зв’язку між Y та окремим Xj.Вони діляться на два типи:
а) парні коефіцієнти кореляції між Y та окремим Xj
б) парні коефіцієнти кореляції між окремими Xk і XjrXkXj(їх для моделі існує m*m);
- частинних коефіцієнтів кореляції, що також характеризують тісноту зв’язку між Y та окремим Xj, але при умові, що інші незалежні змінні сталі, тобто їх варіація не впливає на залежність між Y та Х:
де Rkj – алгебраїчне доповнення до (j,k)-го елемента кореляційної матриці r;