2. Для проведення дисперсійного аналізу складається ANOVA-таблиця (табл. 2.2):
ANOVA-таблиця
Джерело варіації | Кількість ступенів вільності | Сума квадратів | Середні квадрати |
Зумовлене регресією (модель) | К-1 | ||
Не пояснюване за допомогою регресії (помилка) | n-K | ||
Загальне | n-1 | - |
У разі парної регресії К=2 – кількість оцінюваних параметрів.
Для розрахунку ANOVA-таблиці розрахункова табл. 2.1 додається такими графами :
Продовження табл. 2.1
№ спостереження | ( )2 | ( )2 | ( )2 | ||
1 | 6 | 7 | 8 | 9 | 10 |
1 | |||||
2 | |||||
… | |||||
n | |||||
Сума | 0 | ||||
Середнє значення | х | Х | 0 | х | х |
Прогнозне значення |
3. Перевірка моделі на адекватність за допомогою критерія Фішера здійснюється за 6-ти-кроковою схемою.
КРОК 1. Формулюються нульова та альтернативна гіпотези:
- незалежна змінна Х не впливає на значення залежної Y. - значення Х впливає на значення Y.КРОК 2. Задається рівень значущості :
.КРОК 3. Обчислюється F-відношення:
.КРОК 4. Знаходиться критичне значення F-розподілу Фішера при заданому рівні значущості та з (К-1), (n-K) ступенями вільності (функція FРАСПОБР в EXCEL) -
.КРОК 5. Порівнюється розрахункове та критичне значення функції F-розподілу.
КРОК 6. Робиться висновок. Якщо
, тоді гіпотеза відхиляється, якщо , то приймається.4. Розраховуються інші показники адекватності моделі:
1) Середня помилка прогнозу ME:
;2) Дисперсія помилок VAR:
та стандартне відхилення: ;3) Середній квадрат помилки MSE (з ANOVA-таблиці):
або сума квадратів помилок SSE: .4) Абсолютна середня процентна помилка MAPE:
Якщо MAPE<10% - існує висока точність прогнозу;
10%< MAPE<20% - добра точність;
20%< MAPE<50% - задовільна точність;
MAPE>50% - незадовільна точність.
5) Середня процентна помилка MPE:
(MPE<|5%|)
6) Середня абсолютна помилка MAE:
.5. Оцінка значущості коефіцієнта кореляції здійснюється за допомогою t-теста (6 кроків).
КРОК 1. Формулюються нульова та альтернативна гіпотези:
- в генеральній сукупності немає зв’язку між X та Y - коефіцієнт кореляції статистично значущийКРОК 2. Обирається рівень значущості:
.КРОК 3. Знаходиться розрахункове значення t-статистики:
,де R – вибірковий коефіцієнт кореляції.
КРОК 4. За таблицями t-розподілу Ст’юдента знаходиться критичне значення функції розподілу
(функція СТЬЮРАСПОБР в EXCEL).КРОК 5. Розрахункове значення t-статистики порівнюється з табличним. Знаходиться критична зона (рис. 2.1).
КРОК 6. Якщо розрахункове значення t-статистики потрапляє в критичну зону, то
відхиляється, у ішшому випадку - приймається.6. Етапи тестування за критерієм Ст’юдента на значимість параметрів моделі
та .КРОК 1. Формулюються нульова та альтернативна гіпотези:
- оцінка параметру у генеральній сукупності статистично не значимий, - оцінка параметру статистично значимийКРОК 2. Обирається рівень значущості
.КРОК 3. Будується t-статистика для кожного параметру:
,де
- 1МНК оцінка дисперсії параметру ,КРОК 4. За таблицями t-розподілу Ст’юдента знаходиться критичне значення функції розподілу
(функція СТЬЮРАСПОБР в EXCEL).КРОК 5. Розрахункове значення t-статистики порівнюється з табличним. Знаходиться критична зона.
КРОК 6. Якщо значення
не потрапляє в критичну зону, то можна стверджувати з ймовірністю 95%, що оцінка є статистично незначимою – приймається гіпотеза . Інакше – гіпотеза відхиляється.Для того, щоб визначити, як параметри
та пов’язані з дійсними параметрами та , будуються шнтервали довіри для параметрів моделі за формулою: