Нехай прогнозоване значення
визначається по рівнянню регресії з оціненими параметрами(2.1)
В силу того, що
- незміщені оцінки деяких невідомих параметрів відповідного взаємозв'язку, - одне з можливих значень прогнозованої величини при заданих значеннях , точніше - це оцінка середнього значення . Оскільки випадкова величина, то і оцінка також випадкова і має дисперсію. Визначимо її значення.Використавши теорему про дисперсії суми залежних величин, одержимо:
Перепишемо у вигляді:
де
- вектор заданих значень незалежних змінних. Звідки одержимо:Оскільки значення
нам відомо, то введемо в останню формулу її оцінку , звідки дисперсія буде: (2.2)Таким чином, середнє значення
лежить у межах: (2.3)Розділ ІІІ. Лінійний регресійний аналіз інтервальних даних
Перейдемо до багатомірного статистичного аналізу. Спочатку з позиції асимптотичної математичної статистики інтервальних даних розглянемо оцінки методу найменших квадратів (МНК).
Статистичне дослідження залежностей - одне з найбільш важливих задач, які виникають у різних галузях науки й техніки. Під словами "дослідження залежностей" мається на увазі виявлення і опис існуючого зв'язку між досліджуваними змінами на підставі результатів статистичних спостережень.
Якщо яка-небудь група об'єктів характеризується змінними
і проведений експеримент, що складається з n досвідів, де в кожному досвіді ці змінні вимірюються один раз,то експериментатор одержує набір чисел: .Але процес виміру не дає однозначний результат. Реально результатом виміру якої-небудь величини Х є два числа:
- нижня границя і - верхня границя. Причому , де - істинне значення вимірюваної величини. Результат виміру можна записати як . Інтервальне число X може бути представлене іншим способом, а саме, , де . Тут - центр інтервалу (як правило не співпадає з ), а Δx - максимально можлива похибка виміру.3.1 Метод найменших квадратів для інтервальних даних
Нехай математична модель задана:
(3.1.1)
де х = (х1, х2,..., хm) - вектор впливаючих змінних, що піддаються виміру;
- вектор оцінюваних параметрів моделі; у - відгук моделі (скаляр); Q(x, )- скалярна функція векторів х і ; і ε - випадкова похибка.Нехай проведено n досвідів, причому в кожному досвіді обмірювані (один раз) значення відгуку (у) і вектора факторів (х). Результати вимірів можуть бути представлені в наступному виді:
де Х - матриця значень обмірюваного вектора (х) в n досвідах; Y - вектор значень обмірюваного відгуку в n досвідах; Е - вектор випадкових помилок. Тоді виконується матричне співвідношення:
, (3.1.2)
де
, причому - n-мірні вектора, які становлять матрицюВведемо міру близькості
між векторами і . В МНК в якості береться квадратична форма зважених квадратів нев'язань ,тобто
де
- матриця ваг, що не залежить від . Тоді як оцінка можна вибрати таке , при якому міра близькості d(Y,Q) приймає мінімальне значення, тобто .У загальному випадку рішення цього екстремального завдання може бути не єдиним. Тому надалі будемо мати на увазі одне із цих рішень. Воно може бути виражене у вигляді:
причому
неперервні і дифференційовні по (Х,Y) Z, де Z - область визначення функції f(X,Y). Ці властивості функції f(X,Y) дають можливість використати підходи статистики інтервальних даних.Перевага методу найменших квадратів полягає в порівняльній простоті й універсальності обчислювальних процедур. Однак не завжди оцінка МНК є самостійною, що обмежує його застосування на практиці.
Важливим частковим випадком є лінійний МНК, коли Q(x, ) є лінійна функція від
:,
де = 1, а
- вільний член лінійної комбінації. Як відомо, у цьому випадку МНК-оцінка має вигляд:Якщо матриця
невироджена, то ця оцінка є єдиною. Якщо матриця ваг W одинична, тоНехай виконуються наступні припущення щодо розподілу похибок
:- помилки
мають нульові математичні очікування М{ } = 0,- результати спостережень мають однакову дисперсію D {
} = ,- помилки спостережень некорельовані, тобто
.