3.6. Многофакторный корреляционно - регрессионный анализ
Таблица 4. Исходные данные.
год | уровень безраб-цы | доход на душу насел-я | индекс потребит цен | индекс ВРП |
1995 | 12,7 | 83,7 | 278,2 | 86,2 |
1996 | 14,9 | 89,6 | 235,2 | 93,5 |
1997 | 21,3 | 130,5 | 124 | 102,2 |
1998 | 22,2 | 72,2 | 107,9 | 94,2 |
1999 | 17,3 | 99,9 | 163,7 | 108 |
2000 | 19,1 | 111,2 | 144,6 | 104,9 |
2001 | 18,4 | 110,2 | 120,3 | 106,4 |
2002 | 15,4 | 121,5 | 110,6 | 106,4 |
2003 | 16,8 | 104,5 | 114,2 | 106,7 |
2004 | 15,3 | 104,4 | 114,7 | 103,7 |
2005 | 12 | 111,3 | 115,1 | 104,8 |
итого | 185,4 | 1139 | 1628,5 | 1117 |
средн | 16,86 | 103,55 | 148,046 | 101,55 |
Для анализа необходимо из нескольких факторов произвести предварительный отбор факторов для регрессионной модели. Сделаем это по итогам расчета коэффициента корреляции, т.е. возьмем те факторы, связь которых с результативным признаком будет выражена в большей степени. Рассмотрим следующие факторы:
- Доход на душу населения – x1 (%)
- Индекс потребительских цен – x2 (%)
- Индекс ВРП - x3 (%)
Рассчитаем коэффициент корреляции для линейной связи и для имеющихся факторов - x1, x2 и x3:
Для фактора x1 получаем коэффициент корреляции: r1= 0,042
Для фактора x2 получаем коэффициент корреляции: r2 =0,437
Для фактора x3 получаем коэффициент корреляции: r3=0,151
По полученным данным можно сделать вывод о том, что:
1)Связь между x1 и y отсутствует, так как коэффициент корреляции меньше 0,15. Таким образом, возникает необходимость исключить данный фактор из дальнейших исследований.
2)Связь между x2 и y прямая (так как коэффициент корреляции положительный) и умеренная, так как она находится между 0,41 и 0,50. Поэтому, будем использовать фактор в дальнейших расчётах.
3)Связь между x3 и y прямая (так как коэффициент корреляции положительный) и слабая. Тем не менее, будем использовать фактор в дальнейших расчетах.
Таким образом, два наиболее влиятельных фактора – Индекс потребительских цен – x2 и индекс ВРП - x3. Для имеющихся факторов x2 и x3 составим уравнение множественной регрессии.
Проверим факторы на мультиколлинеарность, для чего рассчитаем коэффициент корреляции rx2x3. Подставив имеющиеся данные (из таблицы 10) в формулу, имеем следующее значение: rx2x3=0,747.Полученный коэффициент говорит об очень высокой связи, поэтому дальнейший анализ по обоим факторам вестись не может. Однако в учебных целях продолжим анализ.
Проводим оценку существенности связи с помощью коэффициента множественной корреляции: R=0,512
Так как R < 0,8, то связь признаем не существенной, но, тем не менее, в учебных целях, проводим дальнейшее исследование.
Для определения параметров уравнения необходимо решить систему:
Решив систему, получим уравнение: Ŷ=41,57-0,042 x1-0,183x3
Для данного уравнения найдем ошибку аппроксимации:
A=15,12
А> 5%, то данную модель нельзя использовать на практике.
Проведем оценку параметров на типичность. Рассчитаем значения величин:
S2=28,039
ma=0,886; mb=0,0003; mс=0,017;
ta=41,57/0,886=46,919; tb=-0,042/0,0003=-140; tc=-0,183/0,017=-10,77.
Сравним полученные выше значения t для α = 0,05 и числа степеней свободы (n-2)с теоретическим значением t-критерия Стьюдента, который tтеор = 2,1788. Расчетные значения tbи tс < tтеор, значит данные параметры не значимы и данное уравнение не используется для прогнозирования.
Далее оценим существенность совокупного коэффициента множественной корреляции на основе F-критерия Фишера по формуле:
где: n – число уровней ряда; к – число параметров; R – коэффициент множественной корреляции.
После расчета получаем: F=1,41
Сравним Fрасч с Fтеор для числа степеней свободы U1 = 9 и U2 = 2, видим, что 1,41 < 19,40, то есть Fрасч < Fтеор - связь признаётся не существенной, то есть корреляция между факторами x2, x3 и у не существенна.
3.7. Прогнозирование уровня безработицы
Определив наличие тенденции, можно начать прогнозирование.
I. Сначала проведем прогнозирование методом среднего абсолютного прироста. Для этого надо проверить выполняются ли предпосылки. Вычисляем данные для подстановки в формулы предпосылок:
ρ2=5,88
σ2ост = 4,65
т.к. σ2ост< ρ2 , условие выполняется, значит можно строить прогноз на основе среднего абсолютного прироста. Вычислим средний абсолютный прирост:
, где yp- прогнозируемый уровень; yb- конечный уровень ряда как наиболее близкий к прогнозируемому; L-период упреждения; ∆- средний абс.прирост.Подставляем значения yb=12 L=1 ∆=0,48 в функцию прогноза:
yp=12+0,48*1=12,48 – прогноз на 2006г.
yp=12+0,48*2=12,23 – прогноз на 2007г.
Фактически уровень безработицы в 2006г. составил 14,1%.
Вычислим ошибку прогноза для сравнения методов прогнозирования на точность: 14,1-12,48=1,62.
Теперь составим прогноз методом среднего темпа роста. Вычислим средний темп роста: yp= yb*КL
=1,042Подставим это значение в формулу и составим прогноз на 2006г.:
yp=12*1,0421=12,304
Вычислим ошибку: 14,1-12,304=1,796.
Так как ошибка при прогнозировании методом среднего абсолютного прироста меньше ошибки при прогнозировании методом среднего темпа роста, то можно сделать вывод, что прогнозирование первым методом дает более точные результаты. Поэтому мы оставляем для анализа результатов данные прогноза, полученные методом среднего абсолютного прироста. Составим диаграмму при прогнозировании методом абсолютного прироста.
Рис. 8.Уровень общей безработицы при прогнозировании «методом абсолютного прироста»
II. Следующий способ прогнозирования - методом экстраполяции тренда.
Ранее по аналитическому выравниванию нашли уравнение параболы
второй степени:
=2,46+3,545t-0,205Сделаем прогноз на 2006г., примем t=7, т.к. нумерация дат определена с середины ряда, т.е. ∑t=0.
уp=2,46+3,545*7-0,205*49=17,23 – прогноз на 2006г.
Определим доверительный интервал прогноза, в основе которого лежит показатель колеблемости уровней ряда. Колеблемость уровней ряда определяется по формуле: Sy =
Sy=2,62
Интервал определяется с помощью ошибки прогноза Sp= Sy*Q, где Q- поправочный коэффициент, учитывающий период упреждения.
Q=1,064
Тогда ошибка прогноза: Sp=2,62*1,064=2,79
Соответственно доверительный интервал прогноза составит: уp+t*Sp, где t-табличное значение t-критерия Стьюдента. При ά=0,05 и числе степеней свободы n-3= 11 t=2,2010.
уp+2,2010*2,79 или 17,23 +6,14, т.е. 11,09< уp<23,37
Значит, прогнозная величина находится в данном интервале.
Рис.9. Уровень безработицы при прогнозировании «методом экстраполяции тренда»
III. Метод экспоненциальных средних.
Теперь проведем экспоненциальное сглаживание и прогноз (ExsponentialSmoothingandForecasting) временного ряда в ППП «Statistira 5.5».
Таблица 5. Экспоненциальное сглаживание и прогноз.
Exp. smoothing: S0=19,76 T0=19,08 (new1.sta)
Damped trend, no season ; Alpha=,100 Gamma=,100 Phi=,100
Уровень безработицы
годы | уровень безраб-цы | Qt | остатки |
1992 | 5,8 | 5,8498 | -0,0498 |
1993 | 5,9 | 5,9 | 0 |
1994 | 9,8 | 6,0017 | 3,798 |
1995 | 12,7 | 9,969 | 2,731 |
1996 | 14,9 | 12,919 | 1,981 |
1997 | 22 | 15,157 | 6,843 |
1998 | 22,2 | 22,379 | -0,179 |
1999 | 17,7 | 22,583 | -4,883 |
2000 | 19,1 | 18,005 | 1,095 |
2001 | 18,4 | 19,429 | -1,029 |
2002 | 15,4 | 18,717 | -3,317 |
2003 | 16,9 | 15,666 | 1,234 |
2004 | 15,3 | 17,1914 | -1,8914 |
2005 | 12 | 15,564 | -3,564 |
2006 | 12,2069 |
Рис. 10. Экспоненциальное сглаживание.
Таким образом, по результатам проведенного анализа следует, что уровень безработицы в 2006 году возрастет по сравнению с 2005г. на 0,2% и составит 60,6 тыс.человек.
Заключение
В настоящей работе было рассмотрено такое понятие как безработица, ее сущность. Было выяснено, что безработица бывает фрикционная, структурная, добровольная, институциональная и циклическая, а также технологическая, конверсионная, молодежная, вынужденная, скрытая, застойная и другие. Основными показателями безработицы являются: уровень безработицы, частота, длительность безработицы. Еще в работе была рассмотрена методика расчета этих показателей, основные источники получения информации о безработице, а также методы исследования безработицы: метод статистического учета и методы социологического опроса. В данной работе для прогнозирования использовались методы: