Смекни!
smekni.com

Порушення основних припущень лінійного регресійного аналізу (стр. 9 из 16)

Гіпотеза

відхиляється, якщо

, (1.12.3)

і в цьому випадку кажуть, що регресія значуща; і не відхиляється в супротивному разі (регресія незначуща).

Частинний

-критерій.

Розглянемо 3 моделі:

1.

.

– МНК-оцінки параметрів
.

;
.

2.

.

– МНК-оцінки параметрів
, які не збігаються з оцінками моделі 1.

;
.

3.

.

– МНК-оцінки параметрів
, які не збігаються з оцінками моделей 1, 2.

;
.

Означення 1. Величину

називають додатковою сумою квадратів, обумовленою включенням в модель 2 члена

;
.

Означення 2. Величину

називають додатковою сумою квадратів, обумовленою включенням в модель 3 члена

;
.

Оскільки

,
,

де

– число ступенів вільності, що відповідають середній сумі квадратів
:

,

ми можемо записати 2 частинні

-критерії.

Гіпотеза

(при умові, що
включено в модель) відхиляється, якщо:

,

і не відхиляється в супротивному разі.

Якщо гіпотеза

відхиляється, то коефіцієнт
є значущим, і його необхідно включити в модель.

Якщо гіпотеза

не відхиляється, то включення коефіцієнта
в модель не підвищує значущості регресії, і рівняння можна залишити у вигляді

.

Гіпотеза

(при умові, що
включено в модель) відхиляється, якщо:

,

і не відхиляється в супротивному разі.

Якщо гіпотеза

відхиляється, то коефіцієнт
є значущим, і його необхідно включити в модель.

Якщо гіпотеза

не відхиляється, то включення коефіцієнта
в модель не підвищує значущості регресії, і рівняння можна залишити у вигляді

.

РОЗДІЛ ІІ ДОСЛІДЖЕННЯ ПОРУШЕНЬ ОСНОВНИХ ПРИПУЩЕНЬ ЛІНІЙНОГО РЕГРЕСІЙНОГО АНАЛІЗУ

2.1 „Ідеальна” модель лінійної регресії

Нехай

– незалежні нормально розподілені випадкові величини з однаковою дисперсією
та середніми
, лінійними за параметрами
, де
– невідомі параметри,
– відомі невипадкові величини. Кожну випадкову величину
можна подати у вигляді
, де
– похибки спостережень, і вони змінюються від спостереження до спостереження. Відносно похибок
висуваються припущення:

1)

, – незалежні випадкові величини;

2)

.

За спостереженнями

, які описуються моделлю

(2.1.1)

необхідно оцінити невідомі параметри

.

Означення 2.1.1. «Ідеальною» моделлю лінійної регресії з двома незалежними змінними називатимемо модель виду


(2.1.2)

«Ідеальна» модель лінійної регресії – це модель (2.1.1) з коефіцієнтами

.

Означення 2.1.2. «Ідеальною» моделлю простої лінійної регресії називатимемо модель виду

(2.1.3)

«Ідеальна» модель простої лінійної регресії – це модель (2.1.1) з коефіцієнтами

та змінною
.

Стохастичний експеримент. Проведемо стохастичний експеримент, який полягає в моделюванні вибірок

з нормальних розподілів з параметрами
відповідно, де
а середні
обирались так.

Квадрат

розіб’ємо на 16 однакових квадратів розміром
. В кожному з них оберемо 4 точки, які виступають вершинами квадратів розміром
. Ці 64 вершини квадратів і обрані за значення, які набувають невипадкові змінні
.

Рис. 2.1.1. Вибір значень

, які набувають невипадкові змінні

«Ідеальна» модель простої лінійної регресії. Знайдемо МНК – оцінки параметрів

та перевіримо гіпотези про адекватність та значущість лінійної моделі регресії. Також з’ясуємо, чи виконуються припущення
в „ідеальній” моделі.