соv[εi, εj] =
то D[ε] = σ2In,
D[Y] = D[Y - Xβ] = D[ε], отже D[Y] = σ2In.
Звідси одержуємо
D[
= (X'X)-1X'cov(Y,Y)((X'X)-1X')' = (X'X)-1X'DYX(X'X)-1 =
= (X'X)-1X'σ2IX(X'X)-1 = σ2(X'X)-1(X'X) (X'X)-1 = σ2(X'X)-1 (1.1.10)
Виникає таке питання: чому за оцінку вектора β ми вибираємо саме
Теорема 1.1.4.
Нехай
Доведення.
Оцінку найменших квадратів
= X
при цьому
PX = X(Х'Х)-1X'X = X(Х'Х)-1X'X = XI = X .
Перевіримо, що c'
M[c'
для всіх θ
M[d'Y] = d'MY = d'θ,
Тоді
c'θ = d'θ
Оскільки R(X) = R(P) в силу теореми 1.1.2, то
(c – d)
Pc = Pd
Порахуємо дисперсію оцінки c'
Dc'
= d'P'cov(Y, Y)(d'P')' = d'PDYPd = d'Pσ2IPd = σ2d'Р2d = σ2 d'Рd,
Тоді
D[d'Y] - D[c'
= d'DYd - σ2d'Pd = σ2d'd - σ2d'Pd =
= σ2(d'd - d'Рd) = σ2d'(In - Р)d = {In – P = (In – P)2} =
= σ2 d'(In - Р)(In - Р)d = {In – P = (In – P)'} =
= σ2 d'(In - Р)'(In - Р)d = σ2 [(In - Р)d]'[(In - Р)d] ≥ 0
Рівність нулю досягається тоді й тільки тоді, коли
(In - Р)d = 0
d – Pd = 0
d = Рd = Рс
Тоді D(d'Y) ≥ D(c'
Теорема доведена.
Теорема доведена в припущенні, що матриця X має ранг p, так що Р = X (Х'Х)-1X', і θ =Хβ випливає, що β = (Х'Х)-1Х'θ.
Нехай с' = а'(Х'Х)-1X', тоді звідси оцінка а'β = a'(X’X)-1X'
Зауваження. Якщо похибки εі незалежні й однаково розподілені ε ~
Зокрема, МНК – оцінка
Якщо ж розподіл εi не є нормальним, то МНК – оцінка
Оцінимо параметр σ2 = Dεi, але спочатку сформулюємо низку лем.
Лема 1.1.1. Нехай Y = Y(n×1) – випадковий вектор, А(n×n) = A – симетрична матриця. Якщо MY = θ, DY = ∑, тоді математичне сподівання квадратичної форми Y'AY дорівнює
M(Y'AY) = tr(A∑) + θ'Aθ
.Наслідок
Якщо ∑ = σ2I, то tr(A∑) = σ2trA.
Лема 1.1.2.
Нехай маємо n незалежних випадкових величин Y1, Y2, …, Yn з середніми θ1, θ2, …, θn, однаковими дисперсіями μ2 та однаковими третіми та четвертими центральними моментами μ3 та μ4 відповідно (μr = M(Yi – θi)r). Якщо A = = А(n×n) – симетрична матриця, а a – вектор – стовпець, утворений її діагональними елементами, тоді дисперсія квадратичної форми Y'AY дорівнює
D(Y'AY) = (μ4 – 3(μ2)2)a'a + 2(μ2)2trA2 + 4(μ2)2θ'A2θ + 4μ3θ'Aa
Теорема 1.1.4.
Якщо
М[Y] = Xβ, де Х = X(n×p), rangX = p, D[Y] = σ2 In,
тоді оцінка
є незміщеною оцінкою для σ2.
Доведення.
Похибку ε запишемо у вигляді:
ε = Y -
= (In – X(X'X)-1X')Y = (In - Р)Y.
Тоді
(n - p)S2 = (Y - X
Виразимо Y'(In – P)Y з рівності:
(Y – Xβ)'(In – P)(Y – Xβ) = Y'(In – P)Y – Y'(In – P)Xβ – (Xβ)'(In – P)Y + (Xβ)'(In – P)Xβ;
Y'(In – P)Y = (Y – Xβ)'(In – P)(Y – Xβ) + Y'(In – P)Xβ + (Xβ)'(In – P)Y - (Xβ)'(In – P)Xβ.
Порахуємо M(n – p)S2
M(n – p)S2 = MY'(In – P)Y = {лема 1.1.1} = M(Y – Xβ)'(In – P)(Y – Xβ) +
+ MY'(In – P)Xβ + M(Xβ)'(In – P)Y – M(Xβ)'(In – P)Xβ =
= M(Y – Xβ)'(In – P)(Y – Xβ) + (Xβ)'(In – P)Xβ + (Xβ)'(In – P)Xβ –
- (Xβ)'(In – P)Xβ = M(Y – MY)'(In – P)(Y – MY) =
=