Парный коэффициент корреляции между х1 и х2 рассчитывается по формуле:
Произведем расчет необходимых параметров в таблице 4.4
Таблица 4.4
№ | х1 | х2 | |||||
1 | 118,0 | 105,0 | 27,0 | 44,3 | 1197,00 | 729,00 | 1965,44 |
2 | 28,0 | 56,0 | -63,0 | -4,7 | 294,00 | 3969,00 | 21,78 |
3 | 17,0 | 54,0 | -74,0 | -6,7 | 493,33 | 5476,00 | 44,44 |
4 | 50,0 | 63,0 | -41,0 | 2,3 | -95,67 | 1681,00 | 5,44 |
5 | 56,0 | 28,0 | -35,0 | -32,7 | 1143,33 | 1225,00 | 1067,11 |
6 | 102,0 | 50,0 | 11,0 | -10,7 | -117,33 | 121,00 | 113,78 |
7 | 116,0 | 54,0 | 25,0 | -6,7 | -166,67 | 625,00 | 44,44 |
8 | 124,0 | 42,0 | 33,0 | -18,7 | -616,00 | 1089,00 | 348,44 |
9 | 114,0 | 36,0 | 23,0 | -24,7 | -567,33 | 529,00 | 608,44 |
10 | 154,0 | 106,0 | 63,0 | 45,3 | 2856,00 | 3969,00 | 2055,11 |
11 | 115,0 | 88,0 | 24,0 | 27,3 | 656,00 | 576,00 | 747,11 |
12 | 98,0 | 46,0 | 7,0 | -14,7 | -102,67 | 49,00 | 215,11 |
Итого | 1092,00 | 728,00 | 4974,00 | 20038,00 | 7236,67 | ||
Средне значение | 91,0 | 60,7 |
Тогда коэффициент корреляции между х1 и х2 составит:
При трех переменных для двухфакторного уравнения регрессии рассчитаем определители матрицы парной корреляции и межфакторной корреляции:
;Тогда совокупный коэффициент множественной корреляции составит:
По данным из табл. 2, 3 рассчитаем теперь среднее квадратическое отклонение величин у, х1 и х2 по формулам:
Рассчитаем теперь средние квадратические ошибки коэффициентов регрессии b1 и b2
Оценка значимости коэффициентов чистой регрессии с помощью t-критерия Стьюдента сводится к вычислению значений:
При уровне значимости α = 0,05, df = 11 (n-m-1=12-2-1) степенях свободы табличное значение t-критерия Стьюдента 2,26.
Сравнив его с расчетными значениями, получаем, что
, из чего следует, что гипотезу о несущественности параметра b2 с вероятностью 95% (p = 1 – α) следует отклонить. А вот из чего следует, что гипотезу о несущественности параметра b1 с вероятностью 95% (p = 1 – α) следует принять и признается статистическая незначимость параметра b1.2. Для характеристики относительной силы влияния х1 и х2 на у используя коэффициенты регрессии можно рассчитать средние коэффициенты эластичности. Как правило, их рассчитывают для средних значений факторов и результатов.
С увеличением среднегодовой стоимости основных фондов (х1) на 1% от его среднего уровня, средний объем валового дохода за год увеличится на 0,37% от своего среднего уровня; при повышении среднегодовой стоимости оборотных средств на 1% - увеличится на 0,53% от своего среднего уровня. Очевидно, что сила влияния средней стоимости оборотных средств (х2) на валовой доход (у) оказалась сильнее, чем сила влияния средней стоимости основных фондов (х1).
Рассчитаем линейные коэффициенты частной корреляции
Расчёт линейного коэффициента множественной корреляции и коэффициентов парной корреляции выполнен в п.1 Коэффициент множественной детерминации рассчитывается как квадрат коэффициента множественной корреляции:
Зависимость у от х1 и х2 характеризуется как тесная, в которой 76% вариации валового дохода определяются вариацией учтенных в модели факторов: среднегодовой стоимости основных фондов и среднегодовой стоимости оборотных средств. Прочие факторы, не включенные в модель, составляют соответственно 14% от общей вариации у.4. F –тест Фишера состоит в проверке гипотезы H0 о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого сравнивается фактическое и критическое значение F-критерия Фишера. При уровне значимости α = 0,05, k1 = 2 (m) и k2 = 9 (n-m-1=12-2-1) степенях свободы табличное значение F-критерия Фишера:
Таблица 4.5
№ | у | ŷ | ||
1 | 203 | 197,29 | 7174,61 | 32,65 |
2 | 63 | 80,63 | 1020,85 | 310,91 |
3 | 45 | 73,07 | 1561,63 | 787,69 |
4 | 113 | 100,80 | 138,89 | 148,88 |
5 | 121 | 44,39 | 4650,78 | 5869,60 |
6 | 88 | 98,90 | 187,15 | 118,88 |
7 | 110 | 110,97 | 2,59 | 0,95 |
8 | 56 | 93,91 | 348,78 | 1437,00 |
9 | 80 | 80,01 | 1060,74 | 0,00 |
10 | 237 | 212,75 | 10033,02 | 588,14 |
11 | 160 | 167,62 | 3029,24 | 58,09 |
12 | 75 | 90,66 | 480,55 | 245,29 |
Сумма | 1351,00 | 29688,8 | 9598,1 |
Тогда
> , значит, H0 – гипотеза о случайной природе оцениваемых характеристик откланяется и признается их статистическая значимость и надёжность.Значение средней ошибки аппроксимации найдем по формуле:
Таблица.4.6 Расчет ошибки аппроксимации
№ | у | ŷ | |
1 | 203,0 | 197,29 | 0,03 |
2 | 63,0 | 80,63 | 0,28 |
3 | 45,0 | 73,07 | 0,62 |
4 | 113,0 | 100,80 | 0,11 |
5 | 121,0 | 44,39 | 0,63 |
6 | 88,0 | 98,90 | 0,12 |
7 | 110,0 | 110,97 | 0,01 |
8 | 56,0 | 93,91 | 0,68 |
9 | 80,0 | 80,01 | 0,00 |
10 | 237,0 | 212,75 | 0,10 |
11 | 160,0 | 167,62 | 0,05 |
12 | 75,0 | 90,66 | 0,21 |
13 | 1351,0 | 1351,0 | 2,8 |
14 | 203,0 | 197,29 | 0,03 |
Сумма | 63,0 | 80,63 | 0,28 |
Ошибка аппроксимации показала очень сильное отличие фактического значения результативного признака от теоретического, рассчитанного по множественному уравнению регрессии, что свидетельствует о плохом выборе уравнения регрессии.
Рассчитаем прогнозное значение результата, если прогнозные значения факторов составляют 80% от их максимальных значений.
Задача 5
Имеются данные об объемах продаж в перерабатывающей промышленности и торговле США в течение 5 лет в сопоставимых ценах в млрд. долл.
Месяц | 1 год | 2 год | 3 год | 4 год | 5 год |
Январь | 472,5 | 477,9 | 510,9 | 541,0 | 578,2 |
Февраль | 482,1 | 467,5 | 484,7 | 512,3 | 539,4 |
Март | 489,5 | 470,9 | 486,6 | 512,6 | 545,3 |
Апрель | 493,6 | 469,1 | 488,4 | 511,5 | 551,9 |
Май | 488,0 | 478,1 | 489,5 | 511,9 | 549,7 |
Июнь | 490,6 | 480,6 | 486,6 | 513,9 | 550,1 |
Июль | 492,5 | 479,3 | 491,8 | 520,0 | 554,0 |
Август | 488,1 | 484,2 | 495,2 | 515,9 | 550,0 |
Сентябрь | 493,1 | 484,9 | 491,8 | 524,2 | 565,6 |
Октябрь | 484,5 | 485,6 | 496,1 | 527,1 | 564,7 |
Ноябрь | 483,0 | 486,1 | 498,8 | 529,8 | 566,9 |
Декабрь | 476,9 | 484,7 | 501,5 | 534,9 | 572,7 |
Задание