По территориям Волго-Вятского, Центрально-Черноземного и Поволжского районов известны данные за ноябрь 1998 г.
Район | Потребительские расходы в расчете на душу населения тыс. руб. у | Средняя заработная плата и выплаты социального характера, тыс. руб., х |
Волго-Вятский район | ||
Респ. Марий Эл | 302 | 554 |
Респ. Мордовия | 360 | 560 |
Чувашская респ. | 310 | 545 |
Кировская обл. | 415 | 672 |
Нижегородская обл. | 452 | 496 |
Центрально-Черноземный | ||
Белгородская обл. | 502 | 777 |
Воронежская обл. | 355 | 632 |
Курская обл. | 416 | 688 |
Липецкая обл. | 501 | 833 |
Тамбовская обл. | 403 | 577 |
Поволжский | ||
Респ. Калмыкия | 208 | 584 |
Респ. Татарстан | 462 | 949 |
Астраханскаяобл. | 368 | 888 |
Волгоградская обл. | 399 | 831 |
Пензенская обл. | 342 | 562 |
Саратовская обл. | 354 | 665 |
Ульяновская обл. | 558 | 705 |
Задание
1. Постройте поле корреляции и сформируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, обратной, гиперболической парной регрессии.
3. Оцените тесноту связи с помощью показателей корреляции и детерминации.
4. Рассчитайте коэффициент эластичности.
5. Оцените качество уравнений с помощью средней ошибки аппроксимации.
6. Оцените статистическую надежность результатов регрессионного моделирования с помощью F-критерия Фишера. По значениям характеристик, рассчитанных в пп. 4, 5 и данном пункте, выберите лучшее уравнение регрессии и дайте его обоснование.
7. Рассчитайте ожидаемое значение результата, если прогнозное значение фактора увеличится на 7% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости a=0,05.
8. Оцените полученные результаты.
Построим поле корреляции:
В данном случае можно сформулировать гипотезу о наличии связи между расходами и заработной платы, носящей скорее всего гиперболический характер.
1.1 Построить линейную модель.
Можно сказать, что связь между размером потребительских расходов и средней заработной платы и выплат социального характера.
Значения параметров линейной модели определим, используя данные таблицы 1.
, .Рассчитаем коэффициент детерминации:
Оценку значимости уравнения регрессии проведем с помощью F-критерия Фишера.
Определим среднюю ошибку:
В среднем расчетные значения ý для линейной модели отличаются от фактических значений на 4,04%.
1.2 Построение степенной модели парной регрессии
Уравнение степенной регрессии имеет вид:
Обозначим Y=lgŷ, X=lgx, A=lga.
Тогда уравнение примет вид: Y=A+bX-линейное уравнение регрессии. Рассчитаем его параметры, используя данные таблицы 3.
A=0,001
Уравнение регрессии будет иметь вид: Y=0,001+0,915X
Перейдем к исходным данным уравнения, выполнив потенциирование данного уравнения:
Ŷ=10-0,001*х0,915
Получим уравнение степенной модели регрессии: Ŷ=0,998*х0,915
Определим индекс корреляции:
Рассчитаем критерий Фишера.
Средняя относительная ошибка
1.3 Построение экспоненциальной функции
Ŷ=аbx
Для построения этой модели необходимо провести линериаризацию переменных. Для этого осуществим логарифмирование обеих частей уравнения.
Lgŷ=lga+xlgb
Обозначим Y=lgŷ, B=lgb, A=lga
Получим линейное уравнение регрессии:
Y=A+Bx
Рассчитаем его параметры, используя данные таблицы 4 приложения.
, .Перейдем к исходным данным уравнения, выполнив потенциирование данного уравнения:
Ŷ=100,026*(100,004)x=1,06*1,01x
Связь между показателем у и фактором х можно считать недостаточно сильной. Коэффицент детерминации равен R2=r2XY=0,404
F<Fтабл=4,54 для α=0,05; k1=m=1;k2=n-m-1=15
Средняя относительная ошибка
В среднем расчетные значения ý для экпоненциальной модели отличаются от фактических значений на 5,16%.
1.4 Построение гиперболической функции
Уравнение гиперболической функции:
Ŷ=a+b/x
Проведем линеаризацию модели путем замены Х=1/х. В результате получим линейное уравнение ŷ=a+bX
Рассчитаем его параметры по данным таблицы 5.
, .Получим следующее уравнение гиперболической модели:
Ŷ=31,001+215709,49/х
Определим индекс детерминации:r2=0,951
Вариация результата Y на 95,1% объясняется вариацией фактора Х.
F>Fтабл=4,54 для α=0,05; k1=m=1;k2=n-m-1=15
Средняя относительная ошибка: 0,067*44,106=2,955%
В среднем расчетные значения ý для гиперболической модели отличаются от фактических значений на 2,955%.
1.5 Выбор лучшей модели
Для выбора лучшей модели построим сводную таблицу результатов
Коэффициент детерминации | F-критерий Фишера | Индекс корреляции | Средняя относительная ошибка | |
Линейная | 0,346 | 7,9 | 0,588 | 4,04 |
Степенная | 0,728 | 40,2 | 0,924 | 1,28 |
Экспоненциальная | 0,636 | 0,404 | 10,17 | 5,16 |
Гиперболическая | 0,951 | 291,1 | 0,975 | 2,955 |
Наибольшее значение коэффициента детерминации и критерия Фишера имеет гиперболическая модель. Она же имеет практически наименьшую среднюю относительную ошибку, значит, ее можно взять в качестве лучшей для построения прогноза.
1.6 Расчет прогнозного значения результативного показателя.
.Подставим значение xр в уравнение гиперболической регрессии:
Ŷ=31,001+215709,49/х
Доверительный интервал прогноза для уровня значимости a определяется в виде:
где
Рассчитаем необходимые величины:
; ;