Используя пакет STADIA (Раздел описательная статистика), получаем вектор
:Согласно приведенной формуле
рассчитываем центрированную матрицу (Приложение 2)2. Рассчитываем матрицу
Используя пакет STADIA (меню преобразований), получаем:
=Оценку ковариационной матрицы получим путем умножения матрицы
на множительОбозначим оценку ковариационной матрицы S, используя пакет MathCad находим:
оценка ковариационной матрицы.
Для расчета ковариационной матрицы воспользуемся формулой (1) и определением ковариационной матрицы (2), получаем следующую оценку корреляционной матрицы:
Данный расчет можно провести на прямую, используя пакет STADIA, но наша цель бала показать весь процесс расчета корреляционной матрицы. Проанализируем корреляционную матрицу.
1 – я строка и 1 – столбец это признак у , как видим наибольшая связь наблюдается между признаками х7 и х14 очень тесная (-0,938) , если анализировать парную связь между факторными признаками, то можно заметить наибольшую связь между признаком х5 и х17 (-0,938).
Устранение мультиколлинеарности с помощью метода пошаговой регрессии
Устраним мультиколлинеарность методом пошаговой регрессии,
который предполагает, что на каждом шаге мы будем включать в уравнение регрессии тот признак, который будет вызывать наибольшее приращение коэффициента детерминации.
Шаг 1
Строим уравнения регрессии
Находим максимальный коэффициент детерминации
(где k=1)Вычисляем нижнюю границу коэффициента детерминации
достигнет своего максимума.Используя пакет STADIA определяем:
Переменная | k | ||
X17 | 0.191 | 0.7117 | 1 |
Шаг 2
Строим уравнения регрессии
Находим максимальный коэффициент детерминации
(где k=1)Вычисляем нижнюю границу коэффициента детерминации
достигнет своего максимума.Используя пакет STADIA определяем:
Переменная | k | ||
X7 | 0.7618 | 0.7117 | 1 |
Х7,Х9 | 0.8118 | 0.750 | 2 |
Шаг 3
Строим уравнения регрессии
Находим максимальный коэффициент детерминации
(где k=1)Вычисляем нижнюю границу коэффициента детерминации
достигнет своего максимума.Используя пакет STADIA определяем:
Переменная | k | ||
X7 | 0.7618 | 0.7117 | 1 |
Х7,Х9 | 0.8118 | 0.750 | 2 |
Х7,Х9,X3 | 0.80953 | 0.735 | 3 |
Процесс прекращаем поскольку,
меньше таких коэффициентов для уравнений регрессии с двумя переменными.Подробный анализ, выполненный с помощью программы “Stadia”, приведен в Приложении 1.
Граф.1
Подробные расчеты см. Приложение 1
Таким образом , из анализа исключаются все факторные признаки,
кроме Х7,X9
2. Проверить построенную модель на гетероскедастичность. Построить обобщенную модель множественной регрессии (случай гетероскедастичности остатков)
1.4 Построение и исследование новой модели регрессии.
1.4.1 Вычисление оценок коэффициентов регрессии
Регрессионная модель примет вид:
Вывод т.к.
около 1, то можно считать , что связь тесная.Проверка значимости и построение доверительных интервалов для коэффициентов регрессии
Проверим значимость уравнения регрессии:
H0:<регрессионная модель незначима>
H1:<регрессионная модель значима>
Fвычисленное=57.1
Fкритическое (0,05;2;24)=3,40 так как Fвычисленное > Fкритическое ,
то принимается гипотеза Н1 , следовательно в уравнении коэффициенты регрессии должны быть значимыми.
Проверим значимость коэффициентов регрессии
tкритическое =2.064tвычисленное = .
коэффициент значим. коэффициент значим.
коэффициенты значимы, поскольку
> tкритическое =2.064, < tкритическое ,Построим доверительный интервал для коэффициентов по формуле:
где
остаточная дисперсияИспользуя пакет STADIA находим доверительный интервал для коэффициента при переменной Х7,Х9.
1.4.2 Построение доверительного интервала для результативного признака
Доверительный интервал для результативного признака будем строить , исходя из формулы: ,где t-значение статистики Стьюдента при
истепенях свободы.
Построим доверительный интервал прогноза в точке
, используя пакет STADIA ,находим:Критерий ранговой корреляции Спирмена. По выборочным данным строим регрессионную модель, которую оцениваем с помощью МНК. Вычисляем регрессионные остатки: еi=уi-ýi. Данные объясняющих переменных и остатки ранжируют, после чего исследуют зависимость между хi и εi. Для этого выдвигаем гипотезу Нo: нет зависимости между объясняющей переменной и регрессионными остатками ( она равносильна гипотезе о том, что нет явления гетероскедастичности), Нı: есть зависимость, т.е. явление гетероскедастичности наблюдается. Для проверки гипотезы строится статистика, распределенная нормально с математическим ожиданием равным нулю и дисперсией равной 1: t=
Rх.е ,где Rx,e=1-6*
-коэффициент ранговой корреляции Спирмена, где Di2= rang xi- rang ei .На заданном уровне значимости α=0.05 по таблице нормального распределения находим tкр