Определим общую вариацию:
Таблица 10 – Исходные данные для расчета общей вариации
Рентабельность производства подсолнечника,% | № п/п | ||
97,9 | 1 | -36,1 | 1303,2 |
308,8 | 2 | 174,8 | 30555,0 |
127,6 | 3 | -6,4 | 41,0 |
169,2 | 4 | 35,2 | 1239,0 |
253,2 | 5 | 119,9 | 14376,0 |
-3,1 | 6 | -137,1 | 18796,4 |
65,9 | 7 | -68,1 | 4637,6 |
46,2 | 8 | -87,8 | 7708,8 |
50,6 | 9 | -83,4 | 6955,6 |
19,0 | 10 | -114,0 | 13225,0 |
23,8 | 11 | -110,2 | 12144,0 |
-42,7 | 12 | -152,9 | 23378,4 |
459,3 | 13 | 325,3 | 105820,1 |
143,0 | 14 | 9 | 81 |
203,1 | 15 | 69,1 | 4774,8 |
120,5 | 16 | -13,5 | 182,2 |
151,0 | 17 | 17 | 289,0 |
30,0 | 18 | -104 | 10816,0 |
130,6 | 19 | -3,4 | 11,6 |
392,6 | 20 | 258,6 | 66874 |
211,7 | 21 | 77,7 | 6037,3 |
77,4 | 22 | -56,6 | 3203,6 |
47,1 | 23 | -86,9 | 7551,6 |
134,0 | - | 340001,2 |
При выполнении всех условий применения дисперсионного анализа, разложение общей вариации математически выглядит следующим образом:
Woбщ. = Wфакт + Wост,
Woбщ. - общая вариация наблюдаемых значений (вариант), характеризуется разбросом вариант от общего среднего. Измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Общее разнообразие складывается из межгруппового и внутригруппового;
Wфакт - факторная (межгрупповая) вариация, характеризуется различием средних в каждой группе и зависит от влияния исследуемого фактора, по которому дифференцируется каждая группа.
Dост. - остаточная (внутригрупповая) вариация, которая характеризует рассеяние вариант внутри групп. Отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неуточненных факторов и не зависящую от признака — фактора, положенного в основание группировки. Вариация изучаемого признака зависит от силы влияния каких-то неучтенных случайных факторов, как от организованных (заданных исследователем), так и от случайных (неизвестных) факторов.
Поэтому общая вариация (дисперсия) слагается из вариации, вызванной организованными (заданными) факторами, называемыми факториальной вариацией и неорганизованными факторами, т.е. остаточной вариацией (случайной, неизвестной).
По данным, представленным в таблице 15 определим общую вариацию(
): , (23)где х – уровень рентабельности;
среднее значение уровня рентабельностиТаким образом,
=340001,2 %Определим факторную вариацию (
): , (24)где
среднее значение рентабельности подсолнечника в результате аналитической группировки; %Определим остаточную вариацию:
(25)Определим общую дисперсию:
(26)Определим факторную дисперсию:
= (27)Определим остаточную дисперсию:
, (28)Где N – число групп предприятий
В дисперсионном анализе критерий Фишера позволяет оценивать значимость факторов и их взаимодействия.
Критерий Фишера основан на дополнительных предположениях о независимости и нормальности выборок данных.
Он вычисляется по формуле:
(29) (уровень значимости p = 0,05)Если вычисленное значение критерия F больше критического для определенного уровня значимости и соответствующих чисел степеней свободы для числителя и знаменателя, то дисперсии считаются различными.
Найдем табличное значение F-критерия Фишера при уровнях значимости p = 0,05 и числа степеней свободы числителя и знаменателя- 2 и 22 соответственно: (р=0,05; 2; 20)=3,49
Сравним фактическое и табличное значения Фишера и сделаем определенные выводы.
Так как фактическое значение Фишера меньше табличного (0,0358<3,49), то по данным выборки можно сделать вывод о том, что урожайность подсолнечника не оказывает существенного влияния на рентабельность производства. Однако, на мой взгляд, данный фактор необходимо включить в многофакторную экономико-математическую модель.
Все явления и процессы, характеризующие социально-экономическое развитие тесно взаимосвязаны и взаимозависимы между собой.
В статистике показатели, характеризующие эти явления, могут быть связаны либо корреляционной зависимостью, либо быть независимыми.
Корреляционная зависимость является частным случаем стохастической зависимости, при которой изменение значений факторных признаков (x1, х2, ..., хk) влечет за собой изменение среднего значения результативного признака.
Корреляционная зависимость исследуется с помощью методов корреляционного и регрессионного анализов.
Корреляционный анализ изучает взаимосвязи показателей и позволяет решить следующие задачи:
- Оценка тесноты связи между показателями с помощью парных, частных и множественных коэффициентов корреляции;
- Оценка уравнения регрессии.
Основной предпосылкой применения корреляционного анализа является необходимость подчинения совокупности значений всех факторных (x1, х2, ..., хk) и результативного (У) признаков k-мерному нормальному закону распределения или близость к нему. Если объем исследуемой совокупности достаточно большой (n > 50), то нормальность распределения может быть подтверждена на основе расчета и анализа критериев Пирсона, Ястремского, Боярского, Колмогорова, чисел Вастергарда и т. д. Если n < 50, то закон распределения исходных данных определяется на базе построения и визуального анализа поля корреляции. При этом если в расположении точек имеет место линейная тенденция, то можно предположить, что совокупность исходных данных (У, x1, х2, ..., хk) подчиняется нормальному распределению[7].
Корреляционно-регрессионный анализ как уже отмечалось, используют в случае наличия неполных связей между признаками при большом числе наблюдений. Эти связи классифицируют: по тесноте (слабые, существенные, тесные); по направлению (прямые и обратные); по аналитическому выражению (линейные и нелинейные),. При этом корреляционный анализ имеет цель: определить тесноты связи между двумя признаками (при парной корреляции) и между результативным и множеством факторных признаков ( при многофакторной связи).
Корреляционный анализ должен включать 4 этапа: 1) установление наличия зависимостей в изучаемом явлении; 2) формирование корреляционной модели связи; 3) расчет и анализ показателей связи; 4)статистическая оценка выборочных характеристик связи. При этом в модель не должны попасть факторы, связанные с результатом функционально (статистический анализ таких факторов осуществляется на основе других методов, в частности, индексного). Следует учитывать проблему взаимосвязи между факторами – избегать мультиколлинеарности, включать в уравнение факторы, имеющие тесную взаимосвязь между собой. Кроме того, соотношение числа наблюдений и числа факторов не должно быть менее 8:1-10:1, чтобы получившееся уравнение носило устойчивый характер.
Одновременно с корреляцией используется регрессия, которая исследует форму связи (если таковая вообще имеется).