Смекни!
smekni.com

Порушення основних припущень лінійного регресійного аналізу (стр. 15 из 16)

Отже,

1) лінійна модель адекватна;

2) модель

незначуща (гіпотеза
відхиляється; гіпотеза
не відхиляється, гіпотеза
відхиляється);

3) залишки

некорельовані;

4) залишки

не можна вважати нормально розподіленими;

5) дисперсія залишків

змінна величина.

Лінійна регресія з двома незалежними змінними. Знайдемо МНК – оцінки параметрів

та перевіримо гіпотези про адекватність та значущість лінійної моделі регресії. Також з’ясуємо, чи виконуються припущення
в цій моделі.

Результати стохастичного експерименту, за умов, що значення

обиралися згідно рис.2.1.1, наведено на рисунку 2.5.4.

Рис. 2.5.4. Модель лінійної регресії, в якій спостереження

показниково розподілені

Результати перевірки адекватності та значущості цієї моделі простої лінійної регресії наведено в таблиці 2.5.2.


Таблиця 2.5.2. Результати перевірки адекватності та значущості моделі простої лінійної регресії, в якій спостереження

показниково розподілені

Джерело варіації SS df MS F
Обумовлена регресією 9,3 2 9,3 1,49
Відносно регресії 1989,79 637 3,12
Відносно середнього 1999,09 639
Неадекватність 176,57 61 2,89 0,92
"Чиста помилка" 1813,22 576 3,15

F1 = 0,92 < 1,34 = F0,05;61;576, лінійна модель адекватна.

F2 = 1,49 < 3,01 = F0,05;2;637, регресія

незначуща.

|t1| = 8,42 > 1,96 = t0,025;637, гіпотеза

відхиляється.

|t2| = 99 > 1,96 = t0,025;637, гіпотеза

відхиляється.

|t3| = 100 > 1,96 = t0,025;637, гіпотеза

відхиляється.

Перевіримо припущення про некорельованість залишків

за допомогою критерію Дарбіна-Уотсона. Статистика критерію
. Оскільки
, то залишки
цієї моделі некорельовані.

Рис. 2.5.5. Графік залишків – смуга постійної ширини

Гіпотезу про нормальний розподіл залишків

перевіримо за допомогою критерію
.

Рис. 2.5.6. Нормальний розподіл залишків

Статистика

, тому залишки
не можна вважати нормально розподіленими.

Статистика Бартлетта

, тому дисперсія залишків
змінна величина.

Отже,

1) лінійна модель адекватна;

2) регресія

незначуща (гіпотеза
відхиляється; гіпотеза
не відхиляється, гіпотеза
відхиляється, гіпотеза
відхиляється);

3) залишки

некорельовані;

4) залишки

не можна вважати нормально розподіленими;

5) дисперсія залишків

змінна величина.

ВИСНОВКИ

Нехай

– результат спостереження, який описується лінійною моделлю виду

(1)

де

– регресійна матриця розміру
,
,

– вектор невідомих параметрів,

– вектор похибок спостережень.

Припущення відносно вектора спостережень

позначатимемо
:

.(2)

Або, що те ж саме, припущення відносно вектора похибок

мають вигляд:

(3)

Вихідні припущення (2) або (3) регресійного аналізу виконуються далеко не завжди. Виникає низка питань: як виявити порушення цих припущень? В яких випадках і які порушення можна вважати припустимими? Що робити, якщо порушення виявляються неприпустимими?

Метою роботи є вивчення наслідків порушення основних припущень (3) лінійного регресійного аналізу, а саме:

1) припущення про незміщеність похибок

; (4)

2) припущення про однакову дисперсію і некорельованість похибок

(5)

3) припущення про нормальний розподіл похибок

; (6)

4) припущення про незалежність спостережень

. (7)

Наслідки порушення припущень (4)-(7) розглянемо на прикладі лінійної регресії з двома незалежними змінними.

«Ідеальною» моделлю лінійної регресії з двома незалежними змінними називатимемо модель виду

(8)

«Ідеальна» модель – це модель (1) з коефіцієнтами

.

Опишемо вибір невипадкових змінних

.

Квадрат

розіб’ємо на 16 однакових квадратів розміром
. В кожному з них оберемо 4 точки, які виступають вершинами квадратів розміром
. Ці 64 вершини квадратів і обрані за значення, які набувають невипадкові змінні
.

Рис. 1. Вибір значень

, які набувають невипадкові змінні

Проведемо стохастичний експеримент, який полягає в моделюванні спостережень згідно з моделлю (8).