По значениям средних коэффициентов эластичности можно сделать вывод о более сильном влиянии на результат у признаков фактора х1, чем признаков факторов х2, х3.
Проинтерпретировав средний коэффициент эластичности , получаем, что с увеличением заработной платы работников на 1 руб. объём платных услуг на душу населения увеличится на 1,6% , при условии, что другие факторы остаются постоянными.
Проинтерпретировав средний коэффициент эластичности , получаем, что с увеличением численности работников на 1 человека объём платных услуг на душу населения уменьшится на 0,1%, при условии, что другие факторы остаются постоянными.
Проинтерпретировав средний коэффициент эластичности , получаем, что с увеличением оборота розничной торговли на душу населения на 1 руб. объём платных услуг на душу населения увеличится на 0,4%, при условии, что другие факторы остаются постоянными.
3. Оценим с помощью F-критерия Фишера-Снедекора значимость уравнения линейной регрессии и показателя тесноты связи.
Оценку надежности уравнения регрессии в целом и показатели тесноты связи дает F-критерий Фишера:
Для проверки значимости уравнения выдвигаем две гипотезы:
H0: уравнение регрессии является статистически не значимым.
H1: уравнение регрессии является статистически значимым.
Таблица 3.3 – Дисперсионный анализ данных
df | SS | MS | F | Значимость F | |
Регрессия | 3 | 5,78E+08 | 1,93E+08 | 75,35834 | 3,69E-17 |
Остаток | 43 | 1,1E+08 | 2554841 | ||
Итого | 46 | 6,87E+08 |
По данным таблицы дисперсионного анализа Fфакт. =75,36. Вероятность случайно получить такое значение F-критерия составляет 3,69Е-17, что не превышает допустимый уровень значимости 5 %, об этом свидетельствует величина P- значение из этой же таблицы. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи .
4. Оценим статистическую значимость коэффициентов регрессии с помощью t-критерия Стьюдента.
Выдвигаем две гипотезы:
H0: коэффициенты регрессии является статистически не значимыми, т.е. равны 0.
H1: коэффициенты регрессии является статистически значимыми, т.е. отличны от 0.
Таблица 3.4 – Результаты регрессионного анализа факторов Х1, Х2, Х3
Стандартная ошибка | t-статистика | |
Y-пересечение | 761,5746 | -5,87325 |
Заработная плата работников, Х1 | 0,134205 | 10,2373 |
Численность работников, X2 | 0,022423 | -1,82499 |
Оборот розничной торговли на душу населения, Х3 | 0,046465 | 3,297959 |
Значения случайных ошибок параметров b1, b2, b3 c учетом округления (таблица 3.4):
Если значения t-критерия больше 2,09, можно сделать вывод о существенности параметра, который формируется под воздействием неслучайных причин.
параметр b статистически значим;
параметр b статистически не значим;
параметр b статистически значим.
5. Оценим качество уравнения через среднюю ошибку аппроксимации.
Рассчитаем среднюю ошибку аппроксимации по формуле средней арифметической простой:
Но для этого еще найдем:
Получим:
Таким образом, фактические значения результативного признака отличаются от теоретических значений на 33,1 %. Следовательно, построенная модель является удовлетворительной.
6. Рассчитаем матрицу парных коэффициентов корреляции и отберем информативные факторы в модели. Укажем коллинеарные факторы.
Значения линейных коэффициентов парной корреляции определяют тесноту попарно связанных переменных, использованных в данном уравнении множественной регрессии.
Таблица 3.5 – Матрица коэффициентов парной корреляции
Y | Х1 | X2 | Х3 | |
Y | 1 | |||
Х1 | 0,886194 | 1 | ||
X2 | 0,590571 | 0,553515 | 1 | |
Х3 | 0,670447 | 0,564597 | 0,903082 | 1 |
Из таблицы 3.5 можно заметить, что факторы x2 и x3 мультиколлинеарны, т.к. коэффициенты корреляции превышают 0,75. Таким образом, можно сказать, что они дублируют друг друга.
При отборе факторов в модель предпочтение отдается фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В нашем примере получаем, информативными факторами являются: x1 и x3.
7. Построим модель в естественной форме только с информативными факторами и оценим ее параметры:
Построим уравнение множественной линейной регрессии следующего вида:
Коэффициенты возьмём из таблицы 3.6:
Таблица 3.6 – Результаты регрессионного анализа факторов Х1, Х3,
Коэффициенты | |
Y-пересечение | -3832,012418 |
Заработная плата работников, Х1 | 1,343748976 |
Оборот розничной торговли на душу населения, Х3 | 0,080386804 |
Получаем уравнение следующего вида:
Оно показывает, что при увеличении заработной платы работников на 1 руб. объём платных услуг на душу населения увеличивается на 1,34 руб., при увеличении оборота розничной торговли на душу населения на 1 руб. объём платных услуг на душу населения увеличивается на 0,08 руб.
Уравнение в целом, а также его параметры являются статистически значимыми.
8. Построим модель в стандартизированном масштабе и проинтерпретируем её параметры.
Уравнение в стандартизированном масштабе имеет вид:
Расчет β – коэффициентов выполним по формулам:
Парные коэффициенты корреляции берутся из матрицы (таблица 3.7).
Таблица 3.7 – Матрица коэффициентов парной корреляции
Стандартизированные коэффициенты регрессии показывают, на сколько сигм изменится в среднем результативный признак, если соответствующий фактор изменится на одну сигму при неизменном уровне других факторов.
В нашем случае, при увеличении заработной платы работников на 1 сигму объём платных услуг населению увеличится на 1,17 сигм, при условии что оборот розничной торговли на душу населения остаётся на прежнем уровне. При увеличении оборота розничной торговли на душу населения на 1 сигму объём платных услуг населению увеличится на 0,39 сигм, при условии, что уровень заработной платы остаётся прежним.
На основании проделанной работы можно сделать вывод о том, что наиболее значимыми факторами являются заработная плата работников и оборот розничной торговли на душу населения, по ним мы и построили уравнение регрессии вида:
.
Рассчитаем доверительные интервалы для параметров уравнения регрессии по формулам:
;
;
Тогда:
Таким образом, при увеличении заработной платы работников на 1 руб. объём платных услуг населению будет колебаться от 1,07 до 1,61 руб. При увеличении оборота розничной торговли на душу населения на 1 руб. объём платных услуг населению будет колебаться от 0,03 до 0,13 руб.
В качестве показателя тесноты связи выступает множественный коэффициент корреляции, который в нашем случае R=0,91, такое высокое значение говорит о том, что связь между результативным и факторными признаками тесная (сильная).
Для оценки качества подбора линейной функции используется R2, который называется коэффициентом детерминации. Он характеризует долю дисперсии результативного признака, обусловленную влиянием данных факторов. В нашем случае R2=0,83, это означает, что доля влияния факторных признаков достаточно велика. Следовательно, доля влияния прочих факторов составляет 0,17. Величина коэффициента детерминации служит одним из критериев оценки качества линейной модели. Чем больше доля объясненной вариации, тем соответственно меньше роль прочих факторов. Наша модель имеет хорошее качество, поэтому ею мы воспользуемся для прогнозирования результативного признака (объёма платных услуг населению).
3.2 Прогнозирование среднедушевого объёма платных услуг
Рассчитаем прогнозное значение результата, если прогнозные значения факторов составляют 80% от их максимальных значений.
Рассчитаем ожидаемое прогнозное значение объёма платных услуг на душу населения как точечный прогноз путём подстановки в уравнение регрессии прогнозные значения факторов:
Таблица 3.8– Результат применения инструмента Описательная статистика
Y | X1 | X3 | |||
Среднее | 4876,374468 | Среднее | 5682,511 | Среднее | 13341,98 |
Стандартная ошибка | 563,8853418 | Стандартная ошибка | 312,7184 | Стандартная ошибка | 1751,568 |
Медиана | 2975,5 | Медиана | 5033 | Медиана | 10088 |
Мода | #Н/Д | Мода | #Н/Д | Мода | #Н/Д |
Стандартное отклонение | 3865,803138 | Стандартное отклонение | 2143,889 | Стандартное отклонение | 12008,14 |
Дисперсия выборки | 14944433,9 | Дисперсия выборки | 4596262 | Дисперсия выборки | 1,44E+08 |
Эксцесс | 0,22325654 | Эксцесс | 0,717807 | Эксцесс | 27,09227 |
Асимметричность | 1,214182356 | Асимметричность | 1,094926 | Асимметричность | 4,714512 |
Интервал | 14582,6 | Интервал | 9197 | Интервал | 80166 |
Минимум | 480,5 | Минимум | 2691 | Минимум | 4088 |
Максимум | 15063,1 | Максимум | 11888 | Максимум | 84254 |
Сумма | 229189,6 | Сумма | 267078 | Сумма | 627073 |
Счет | 47 | Счет | 47 | Счет | 47 |
для фактора х1: хпр=0,8*11888=9510