Смекни!
smekni.com

Регресійний аналіз інтервальних даних (стр. 1 из 6)

МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ

ДНІПРОПЕТРОВСЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ

ДИПЛОМНА РОБОТА

Регресійний аналіз інтервальних даних

Виконала:студентка групи МС-03-1

Припутень Ю.А.

Дніпропетровськ

2008

Реферат

Об’єкт дослідження: алгоритми регресійного аналізу пристосовані для обробки інтервальних даних.

Мета роботи: розробити програму, яка здійснює знаходження інтервалів для коефіцієнтів регресії. Програма повинна дозволяти подавати результати у вигляді зручному для користувачів, мати інтерфейс та бути зручною у користуванні.

Одержані висновки та їх новизна: в роботібув створений алгоритм для знаходження інтервальних оцінок коефіцієнтів та розроблено програмне середовище, що дозволяє досліджувати роботу цього алгоритму.

Результати дослідження можуть бути застосовані для обробки статистичної інформації.

Перелік ключових слів: лінійна регресія, метод найменших квадратів, інтервальні дані.

Зміст

Вступ

Розділ І. Лінійна багатовимірна регресія

Розділ ІІ. Довірчі інтервали регресії. Похибка прогнозу

Розділ ІІІ. Лінійний регресійний аналіз інтервальних даних

3.1Метод найменших квадратів для інтервальних даних

3.2Метод найменших квадратів для лінійної моделі

3.3 Парна регресія

Розділ IV. Програмний продукт «Інтервальне значення параметрів»

4.1 Текст програми

4.2 Опис програми

4.3 Результати роботи програми

Висновки

Список використаних джерел

Вступ

Перспективний і швидко прогресуючий напрямок останніх років – математична статистика інтервальних даних. Мова йде про розвиток методів математичної статистики в ситуації, коли статистичні дані - не числа, а інтервали, породжені накладенням помилок виміру на значення випадкових величин.

Дана дипломна робота складається з чотирьох розділів. Перші три розділі мають реферативний характер. В першому розділі викладені деякі поняття класичної теорії регресійного аналізу. В другому розділі розглянуті довірчі інтервали для коефіцієнтів регресії. В третьому розділі наведені ідеї і підходи лінійного регресійного аналізу інтервальніх даних. В четвертому розділі викладені результати дипломної роботи. Тут наведено алгоритм, текст та опис розроблених програм, які здійснюють знаходження нотни та оцінок коефіцієнтів регресії в класичному вигляді та в інтервальних даних.

За допомогою розроблених програм в цьому ж розділі наведено результати експериментального дослідження залежності величин інтервалів, які накривають коефіцієнти регресії в залежності від об’єму вибірки та величин інтервалів в яких знаходяться значення координат вибірки.

Програми створені за допомогою середовища Maple, так як воно по всім параметрам (швидкість, надійність, простота у використанні) підходить для написання цих програм.

Постановка задачі. В роботі необхідно розв’язати такі задачі:

1. Розробити програму. Програма повинна працювати з вибірками довільної вимірності і довільними векторами найбільших похибок для кожної координати.

2. Провести чисельно дослідження залежності верхньої та нижньої меж інтервалів, що накривають коефіцієнти регресії, в залежності від об’єму вибірки і векторів найбільших похибок для кожної координати.

Розділ І. Лінійна багатовимірна регресія

Нехай

- деяка випадкова величина, флуктує навколо деякого невідомого значення параметра
, тобто
, де
- флуктуація або похибка. Наприклад, похибка
може бути властива самому експерименту, або похибка може виникати при вимірювані невідомого параметра
.

Припустимо тепер, що

можна представити у вигляді

де

- відомі постійні величини, а
– невідомі параметри, які потрібно оцінити.

Якщо величина

змінюється і при цьому змінна
набуває значень
, тобто можна записати

(1.1)

У матричному вигляді, отримаємо:

Або


(1.2)

де

.

Означення: Матриця

розміру
називається регресійною матрицею. При цьому її елементи
обираються таким чином, щоб
, тобто число лінійних незалежних стовпців дорівнювало
, також матрицю
називають матрицею повного рангу.

Але в деяких випадках

приймає лише два значення 0, 1, тоді можливі випадки коли в матриці
деякі рядки або стовпці збігаються, тобто є лінійно – залежними. В цьому випадку
називають матрицею плану. Змінні
називають регресорами (j=1,…,p-1), або предикторними змінними, а
- називають відкликом.

Модель (1) або (2) лінійна відносно невідомих параметрів. Тому її називають лінійною моделлю.

Перед тим як оцінювати вектор

, замітимо, що вся теорія будується для моделі (2).

Для оцінки невідомих параметрів

використовують метод найменших квадратів (МНК), який полягає в мінімізації суми квадратів залишків. Необхідно мінімізувати величину:

(1.3)

за параметрами

. Вираз (1.3) запишеться так:

(1.4)

Шукаємо градієнт

:

Розв’язуємо рівняння:

Таким чином

(1.5)

Необхідно перевірити, що знайдена стаціонарна точка є точкою мінімуму функції

. Справедлива така тотожність

Перевіримо цю рівність:


Ліва частина тотожності мінімальна якщо

.

Регресію будемо позначати

.

Залишок

Мінімальне значення суми квадратів залишків

називають залишковою сумоюквадратів (RSS).

Застосуємо формулу (2.1), RSS перепишеться:

Якщо застосувати формулу (2.2), отримаємо:


.

Оцінки

та
єдині.

Розділ ІІ. Довірчі інтервали регресії. Похибка прогнозу