Целью регрессионного анализа является оценка функциональной зависимости условного среднего значения результативного признака (У) от факторных (У, x1, х2, ..., хk).
Основной предпосылкой регрессионного анализа является то что только результативный признак (У) подчиняется нормальному закону распределения, а факторные признаки x1, х2, ..., хk могут иметь произвольный закон распределения. При этом в регрессионном анализе заранее подразумевается наличие причинно-следственных связей между результативным (У) и факторными (x1, х2, ..., хk) признаками. При этом форма связи между явлениями выражается аналитическим уравнением, на основании которого по соответствующим факторам определяется значение результативного показателя функции. Сложность заключается в том, что из бесконечного множества функций требуется найти такую, которая лучше других будем выражать реально существующие связи между изучаемым показателем и факторами. Выбор функции может опираться на теоретические знания изучаемого явления или на опыт предыдущих исследований.
Уравнение множественной регрессии можно строить в линейной форме:
Каждый коэффициент данного уравнения показывает степень влияния соответствующего фактора на анализирующий показатель при фиксированном положении остальных факторов: с изменением каждого фактора на единицу показатель изменяется на соответствующий коэффициент регрессии. Свободный член уравнения экономического смысла не имеет. С помощью многофакторного корреляционного анализа находятся различного рода характеристики тесноты связи между изучаемым показателем и факторами.
Теснота связи количественного выражения величиной коэффициентов корреляции. Коэффициент корреляции представляет количественную характеристику тесноты связи между признаками, дают возможность определять полезность факторных признаков.
Коэффициент корреляции всегда меньше единицы, и изменяется в пределах от -1 до +1. Знаки коэффициентов регрессии и корреляции всегда совпадают.
Помимо коэффициента корреляции, необходимо определять коэффициент детерминации. Он показывает, какая доля вариации результативного признака обусловлена изменением факторных признаков или факторного, входящих в многофакторную регрессионную модель.
По мере развития экономики роль и значение корреляционно-регрессионных методов в экономическом анализе повышается, рассматриваются масштабы их применение, совершенствуется методика. Использование разработанных к настоящему времени статистических методов анализа позволяет изучить, измерить и дать количественное выражение взаимосвязей между явлениями общественной жизни, установленными на основе качественного анализа. Поэтому так важно применение корреляционно-регрессионных методов на практике.
На данной стадии исследования нами поставлена задача построения многофакторной корреляционно-регрессионной модели уровня окупаемости подсолнечника Павловского, Петропавловского, Воробьевского и Аннинского районов Воронежской области. Для построения экономико-математической модели уровня окупаемости подсолнечника используем исходные данные (см.приложение 8) и следующие факторы:
- X1 – урожайность подсолнечника, ц/га;
- X2 – трудоемкость 1 ц подсолнечника, Чел.час;
- X3 – себестоимость 1 ц реализованного подсолнечника, руб.;
- X4 – уровень интенсивности, руб.;
- X5 – уровень специализации, %;
- X6 – удельный вес затрат на подсолнечник в растениеводстве, %;
- Х7 – уровень концентрации (посевная площадь), %;
- X8 – трудообеспеченность (число работников на 100 га пашни), чел.
Исходная информация (см. приложение 3) введена в пакет диалоговой статистики и по программе Statgraph построена модель множественной регрессии.
Таблица 11 - Экономико-математическая модель уровня окупаемости подсолнечника по предприятиям Павловского, Петропавловского, Воробьевского и Аннинского районов Воронежской области
Условное | Коэффициент | Стандартная ошибка | t-статистика | Уровень |
обозначение | регрессии | значимости | ||
CONSTANT | 480,969178 | 184,890105 | 2,6014 | 0,0209 |
x1 | -2,4372,89 | 6,334282 | -0,3848 | 0,7062 |
x2 | -48,585345 | 33,102449 | -1,4677 | 0,1643 |
x3 | 0,066724 | 0,22405 | 0,2978 | 0,7702 |
x4 | 0,009309 | 0,013108 | 0,7102 | 0,4892 |
x5 | 2,192469 | 0,879087 | 2,4940 | 0,0258 |
x6 | -6,370657 | 3,957274 | -1,6099 | 0,1297 |
х7 | 0,067432 | 0,051424 | -1,3113 | 0,2190 |
х8 | -57,55466 | 46,691083 | -1,2327 | 0,2380 |
R-SQ (ADJ)=0,1777 SE 95,63241 Previous: 0,1245 99,85412 |
Коэффициент детерминации в данной полученной модели = 17,77%, следовательно, на долю неучтенных факторов, которые влияют на уровень окупаемости подсолнечника приходится 82,23%. Это говорит о том, что статистическая оценка характеристик данной модели показывает, что некоторые факторы количественно мало изменяют результат, а влияние некоторых факторов не поддается логико-экономическому осмыслению Множественный коэффициент корреляции =4,21%, следовательно, связь между уровнем окупаемости и заложенными в модель факторами
На наш взгляд, данную экономико-математическую модель можно улучшить, так как уровень значимости некоторых факторов больше 0,05 и, как сказано выше, связь между некоторыми факторам и результативным признаком (уровень окупаемости) не поддается логико-экономическому осмыслению.
Из данной модели мы исключаем некоторые факторы, а именно – х1, х3, х4, х7 и х8.
Компьютерная программа позволяет просчитать ряд вариантов и выбрать наиболее значимую модель.
Таблица 12 - Улучшенная экономико-математическая модель уровня окупаемости подсолнечника по предприятиям Павловского, Петропавловского, Воробьевского и Аннинского районов Воронежской области
Условное | Коэффициент | Стандарт-ная ошибка | t-статистика | Уровень |
обозначение | регрессии | значимости | ||
CONSTANT | 271,176866 | 46,992045 | 5,1107 | 0,0000 |
Х2 | -23,0881171 | 18,111291 | -1,3186 | 0,2030 |
Х5 | 1,991439 | 0,753457 | 2,6431 | 0,0160 |
Х6 | -3,092463 | 2,193704 | -1,4097 | 0,1748 |
R-SQ (ADJ)=0,2844 SE 108,821689 Previous: 0,2491 111,475199 |
Данная экономико-математическая модель улучшилась, так как коэффициент детерминации = 28,44%, а коэффициент корреляции =5,33%, следовательно, на долю неучтенных факторов приходится 71,6%, а теснота связи между факторами и результативным признаком
Полученная модель количественно измеряет исследуемую связь и можно представить в виде уравнения регрессии:
Ух2,х5,х6 = 271,177-23,088х2+1,991х5-3,092х6;
Коэффициент регрессии а1 = -23,088 говорит о том, что с увеличением трудоемкости подсолнечника на 1 ц, чел.-час. Уровень окупаемости подсолнечника снижается на 23,088 %; коэффициент регрессии а2 = 1,991 говорит о том, что с повышением уровня специализации уровень окупаемости увеличивается на 1,991%; коэффициент регрессии а3 = 3,092 говорит о том, что с увеличением удельного веса затрат на подсолнечник в растениеводстве, уровень окупаемости подсолнечника повышается 3,092 % .
Таким образом, путем исключения нескольких факторов из модели, мы выявили определенное влияние отдельных факторов.
На ряду с количественным измерением факторов важное значение имеет измерение тесноты изучаемой связи, коэффициента множественной регрессии R=0,17.
Связь между трудоемкостью 1 ц подсолнечника и факторами заложенными в модель - тесная. А коэффициент детерминации R2 = 0,2844=28,44% говорит о том, что уровень окупаемости подсолнечника в изучаемой совокупности предприятий на 28,44% зависит от факторов заложенной в модели и 28,44% от других факторов. Следовательно, при изучении окупаемости подсолнечника в дальнейшем нужно обратить внимание на показатели, которые не вошли в модель.
С целью оценки существенности влияния изучаемых факторов на урожайность построим многофакторный дисперсионный комплекс.
Таблица 13 - Дисперсионный анализ вариации для всей модели
Источник вариации | Величина вариации | Число степеней свободы | Дисперсия | Фактическое значение критерия Фишера | Уровень ошибки исследования |
Факторная | 139067 | 3 | 46355,6 | 3,91445 | 0,0248 |
Остаточная | 225001 | 19 | 11842,2 | - | - |
Общая | 364068 | 22 | - | - | - |
Так как фактическое значение критерия Фишера больше теоретического, то влияние заложенных факторов в модель существенно.
Определенную информацию об адекватности уравнения регрессии даёт исследование регрессионных остатков. Если выборочная регрессия удовлетворительно описывает истинную регрессионную зависимость, то остатки должны быть независимыми нормально распределенными случайными величинами с нулевым средним, и в их значениях должен отсутствовать тренд. Для проверки независимости остатков используется статистика Дарбина-Уотсона.
Критерий Дарбина-Уотсона=1,18603 говорит о том, что автокорреляция факторов несущественно влияет на результат.
Оценить существенность влияния факторов по всей модели в целом, интересно знать, как влияет каждый фактор на результат:
Таблица 14 - Дисперсионный анализ вариации в порядке влияния отдельных факторов на результат
Источник вариации | Величина вариации | Число степеней свободы | Дисперсия | Фактическое значение критерия Фишера | Уровень ошибки исследования |
Х1 | 52742,4691 | 1 | 52742,469 | 4,45 | 0,0483 |
Х2 | 62790,8303 | 1 | 62790,830 | 5,30 | 0,0328 |
Х3 | 23533,3573 | 1 | 23533,357 | 1,99 | 0,1748 |
Model | 139066,653 | 3 | - | - | - |
Данные таблицы свидетельствуют о том, что наибольшее существенное влияние на уровень окупаемости подсолнечника оказали: трудоемкость 1 ц подсолнечника, уровень специализации и повышение удельного веса затрат на подсолнечник в затратах растениеводства. Разработанная экономико-математическая модель отражает условия производства подсолнечника, поэтому может быть использована для оценки результатов деятельности этих предприятий и в частности для расчета резервов повышения уровня окупаемости и денежной выручки за реализацию подсолнечника.