следовательно, гипотеза H0 отвергается, принимается альтернативная гипотеза H1: с вероятностью 1-α=0,95 полученное уравнение статистически значимо, связь между переменными x и y неслучайна.
3. Выбор лучшего уравнения.
Составим таблицу полученных результатов исследования.
Таблица 4
Уравнение | Коэффициент (индекс) корреляции | Коэффициент (индекс) детерминации | Средняя ошибка аппроксимации | Коэффициент эластичности |
линейное | 0,951 | 0,905 | 6,65 | 0,515 |
полулогагифмическое | 0,915 | 0,838 | 8,74 | 0,414 |
степенное | 0,936 | 0,878 | 7,06 | 0,438 |
Анализируем таблицу и делаем выводы.
- Все три уравнения оказались статистически значимыми и надежными, имеют близкий к 1 коэффициент (индекс) корреляции, высокий (близкий к 1) коэффициент (индекс) детерминации и ошибку аппроксимации в допустимых пределах.
- При этом характеристики линейной модели указывают, что она несколько лучше полулогарифмической и степенной описывает связь между признаками x и у.
- Поэтому в качестве уравнения регрессии выбираем линейную модель.
4. Для выбранной модели проверим предпосылку МНК о гомоскедастичности остатков, т. е. о том, что остатки регрессии имеют постоянную дисперсию.
Используем метод Гольдфельдта-Квандта.
1. Упорядочим наблюдения по мере возрастания переменной х.
2. Исключим из рассмотрения 3 центральных наблюдения.
3. Рассмотрим первую группу наблюдений (малые значения фактора х) и определим
этой группы.4. Рассмотрим вторую группу наблюдений (большие значения фактора х) и определим
этой группы.5. Проверим, значимо или незначимо отличаются дисперсии остатков этих групп.
Таблица 5
№ | x | y | yx | x2 | y2 | |||
1 | 4,1 | 14,2 | 58,22 | 16,81 | 201,64 | 15,47 | -1,27 | 1,60 |
2 | 5,3 | 18,4 | 97,52 | 28,09 | 338,56 | 16,50 | 1,90 | 3,61 |
3 | 7,1 | 16,4 | 116,44 | 50,41 | 268,96 | 18,05 | -1,65 | 2,72 |
4 | 8,5 | 21,7 | 184,45 | 72,25 | 470,89 | 19,26 | 2,44 | 5,97 |
5 | 10,2 | 18,5 | 188,70 | 104,04 | 342,25 | 20,72 | -2,22 | 4,93 |
6 | 11,0 | 22,2 | 244,20 | 121,00 | 492,84 | 21,41 | 0,79 | 0,63 |
сумма | 46,2 | 111,4 | 889,53 | 392,60 | 2115,14 | 111,40 | 0,00 | 19,46 |
среднее | 7,70 | 18,57 | 148,26 | 65,43 | 352,52 | 18,57 | 0,00 | 3,89 |
Определим параметры уравнения регрессии 1 группы:
Уравнение регрессии 1 группы:
=11,93+0,86x
Таблица 6
№ | x | y | yx | x2 | y2 | |||
10 | 18,3 | 28,2 | 516,06 | 334,89 | 795,24 | 27,56 | 0,64 | 0,41 |
11 | 18,6 | 26,1 | 485,46 | 345,96 | 681,21 | 27,85 | -1,75 | 3,06 |
12 | 19,7 | 30,2 | 594,94 | 388,09 | 912,04 | 28,92 | 1,28 | 1,63 |
13 | 21,3 | 28,6 | 609,18 | 453,69 | 817,96 | 30,49 | -1,89 | 3,56 |
14 | 22,1 | 34,0 | 751,40 | 488,41 | 1156,00 | 31,27 | 2,73 | 7,47 |
15 | 24,2 | 32,3 | 781,66 | 585,64 | 1043,29 | 33,32 | -1,02 | 1,03 |
сумма | 124,2 | 179,4 | 3738,70 | 2596,68 | 5405,74 | 179,40 | 0,00 | 17,17 |
среднее | 20,70 | 29,90 | 623,12 | 432,78 | 900,96 | 29,90 | 0,00 | 3,43 |
Параметры уравнения регрессии 2 группы:
Уравнение регрессии 2 группы:
=9,7+0,98x
S1=19.46>S2=17.17
Fфакт.< Fтабл.
следовательно, остатки гомоскедастичны, предпосылки МНК не нарушены.
5. Рассчитаем прогнозное значение результата у, если прогнозное значение фактора х увеличивается на 5% от его среднего уровня.
Точечный прогноз:
11,59+0,871,0514,13=24,515 млн. руб.Для данной величины выпуска продукции прогнозное значение затрат на производство составляет 24,515 млн. руб.
Для уровня значимости α= 0,05 определим доверительный интервал прогноза.
Предварительно определим стандартные ошибки коэффициента корреляции и параметра b.
Стандартная ошибка коэффициента корреляции:
Ошибка прогноза:
Доверительный интервал прогноза значений y при
с вероятностью 0,95 составит:Прогноз надежный, но не очень точный, т. к.
Задание 2
Имеются данные о заработной плате у (тысяч рублей), возрасте х1(лет), стаже работы по специальности х2 (лет) и выработке х3 (штук в смену) по 15 рабочим цеха:
№ | y | х1 | х2 | х3 |
1 | 3,2 | 30 | 6 | 12 |
2 | 4,5 | 41 | 18 | 20 |
3 | 3,3 | 37 | 11 | 12 |
4 | 3,0 | 33 | 9 | 18 |
5 | 2,8 | 24 | 4 | 15 |
6 | 3,9 | 44 | 19 | 17 |
7 | 3,7 | 37 | 18 | 17 |
8 | 4,2 | 39 | 22 | 26 |
9 | 4,7 | 49 | 30 | 26 |
10 | 4,4 | 48 | 24 | 22 |
11 | 2,9 | 29 | 8 | 18 |
12 | 3,7 | 31 | 6 | 20 |
13 | 2,4 | 26 | 5 | 10 |
14 | 4,5 | 47 | 19 | 20 |
15 | 2,6 | 29 | 4 | 15 |
Требуется:
1. С помощью определителя матрицы парных коэффициентов межфакторной корреляции оценить мультиколлинеарность факторов, исключить из модели фактор, ответственный за мультиколлинеарность.
2. Построить уравнение множественной регрессии в стандартизованной форме:
2.1. Оценить параметры уравнения.
2.2. Используя стандартизованные коэффициенты регрессии сравнить факторы по силе их воздействия на результат.
2.3. Оценить тесноту связи между результатом и факторами с помощью коэффициента множественной корреляции.
2.4. Оценить с помощью коэффициента множественной детерминации качество модели.
2.5. Используя F-критерий Фишера оценить статистическую значимость присутствия каждого из факторов в уравнении регрессии.