Смекни!
smekni.com

Корреляционно-регрессионный анализ взаимосвязи производственных показателей предприятия организ (стр. 2 из 10)

Формы проявления взаимосвязей весьма разнообразны. В качестве двух самых общих их видов выделяют функциональную (полную) и корреляционную (неполную) связи. В первом случае величине факторного признака строго соответствует одно или несколько значений функции. Достаточно часто функциональная связь проявляется в физике, химии. В экономике примером может служить прямо пропорциональная зависимость между производительностью труда и увеличением производства продукции.

Корреляционная связь (которую также называют неполной, или статистической) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной. Объяснение тому – сложность взаимосвязей между анализируемыми факторами, на взаимодействие которых влияют неучтенные случайные величины. Поэтому связь между признаками проявляется лишь в среднем, в массе случаев. При корреляционной связи каждому значению аргумента соответствуют случайно распределенные в некотором интервале значения функции.

Например, некоторое увеличение аргумента повлечет за собой лишь среднее увеличение или уменьшение (в зависимости от направленности) функции, тогда как конкретные значения у отдельных единиц наблюдения будут отличаться от среднего. Такие зависимости встречаются повсеместно. Например, в сельском хозяйстве это может быть связь между урожайностью и количеством внесенных удобрений. Очевидно, что последние участвуют в формировании урожая. Но для каждого конкретного поля, участка одно и то же количество внесенных удобрений вызовет разный прирост урожайности, так как во взаимодействии находится еще целый ряд факторов (погода, состояние почвы и др.), которые и формируют конечный результат. Однако в среднем такая связь наблюдается – увеличение массы внесенных удобрений ведет к росту урожайности.

По направлению связи бывают прямыми, когда зависимая переменная растет с увеличением факторного признака, и обратными, при которых рост последнего сопровождается уменьшением функции. Такие связи также можно назвать соответственно положительными и отрицательными.

Относительно своей аналитической формы связи бывают линейными и нелинейными. В первом случае между признаками в среднем проявляются линейные соотношения. Нелинейная взаимосвязь выражается нелинейной функцией, а переменные связаны между собой в среднем нелинейно.

Существует еще одна достаточно важная характеристика связей с точки зрения взаимодействующих факторов. Если характеризуется связь двух признаков, то ее принято называть парной. Если изучаются более чем две переменные – множественной.

Указанные выше классификационные признаки наиболее часто встречаются в статистическом анализе. Но, кроме перечисленных различают также непосредственные, косвенные и ложные связи. Собственно, суть каждой из них очевидна из названия. В первом случае факторы взаимодействуют между собой непосредственно. Для косвенной связи характерно участие какой-то третьей переменной, которая опосредует связь между изучаемыми признаками. Ложная связь – это связь, установленная формально и, как правило, подтвержденная только количественными оценками. Она не имеет под собой качественной основы или же бессмысленна.

По силе различаются слабые и сильные связи. Эта формальная характеристика выражается конкретными величинами и интерпретируется в соответствии с общепринятыми критериями силы связи для конкретных показателей.

В наиболее общем виде задача статистики в области изучения взаимосвязей состоит в количественной оценке их наличия и направления, а также характеристике силы и формы влияния одних факторов на другие. Для ее решения применяются две группы методов, одна из которых включает в себя методы корреляционного анализа, а другая – регрессионный анализ. В то же время ряд исследователей объединяет эти методы в корреляционно-регрессионный анализ, что имеет под собой некоторые основания: наличие целого ряда общих вычислительных процедур, взаимодополнения при интерпретации результатов и др.

Поэтому в данном контексте можно говорить о корреляционном анализе в широком смысле – когда всесторонне характеризуется взаимосвязь. В то же время выделяют корреляционный анализ в узком смысле – когда исследуется сила связи – и регрессионный анализ, в ходе которого оцениваются ее форма и воздействие одних факторов на другие.

Задачи собственно корреляционного анализа сводятся к измерению тесноты связи между варьирующими признаками, определению неизвестных причинных связей и оценке факторов оказывающих наибольшее влияние на результативный признак.

Задачи регрессионного анализа лежат в сфере установления формы зависимости, определения функции регрессии, использования уравнения для оценки неизвестных значении зависимой переменной.

Решение названных задач опирается на соответствующие приемы, алгоритмы, показатели, применение которых дает основание говорить о статистическом изучении взаимосвязей.

3. Корреляционно-регрессионный анализ

Для выявления наличия связи, ее характера и направления в статистике используют методы: приведения параллельных данных; аналитических группировок; графический, корреляции.

Корреляционно-регрессионный анализ включает в себя измерение тесноты, направления связи и установление аналитического выражения (формы) связи (регрессионный анализ).

Одним из методов корреляционно-регрессионного анализа является метод парной корреляции, рассматривающий влияние вариации факторного признака x на результативный y. Аналитическая связь между ними описывается уравнениями:

прямой

параболы

гиперболы

и т.д.

Оценка параметров уравнения регрессии осуществляется методом наименьших квадратов, в основе которого лежит требование минимальности сумм квадратов отклонений эмпирических данных yi от выровненных (теоретических) yxi

(1)

Система нормальных уравнений для нахождения параметров линейной парной регрессии имеет вид:

(2)

Для оценки типичности параметров уравнения регрессии используется t-критерий Стьюдента. При этом вычисляются фактические значения t-критерия для параметров. Полученные фактические значения сравниваются с критическим, которые получают по таблице Стьюдента с учетом принятого уровня значимости и числа степеней свободы.

Полученные при анализе корреляционной связи параметры уравнения регрессии признаются типичными, если t фактическое больше t критического.

По приведенным на типичность параметрам уравнения регрессии производится синтезирование (построение) математической модели связи. При этом параметры примененной в анализе математической функции получают соответствующие количественные значения: один параметр показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов, а другой параметр – на сколько изменяется в среднем значение результативного признака при изменении факторного на единицу его собственного измерения.

Проверка практической значимости синтезированных в корреляционно-регрессионном анализе математических моделей осуществляется посредством показателей тесноты связи между признаками x и y.

Для статистической оценки тесноты связи применяются следующие показатели вариации:

1. общая дисперсия результативного признака, отображающая общее влияние всех факторов;

2. факторная дисперсия результативного признака, отображающая вариацию y только от воздействия изучаемого фактора, которая характеризует отклонение выровненных значений yx от их общей средней величины y;

3. остаточная дисперсия, отображающая вариацию результативного признака y от всех прочих, кроме x факторов, которая характеризует отклонение эмпирических (фактических) значений результативного признака yi от их выровненных значений yxi.

Соотношение между факторной и общей дисперсиями характеризует меру тесноты связи между признаками x и y

(3)

Этот показатель называется индексом детерминации (причинности). Он выражает долю факторной дисперсии, т.е. характеризует, какая часть общей вариации результативного признака y объясняется изменением факторного признака x. На основе предыдущей формулы определяется индекс корреляции R:

(4)

Используя правило сложения дисперсий, можно вычислить индекс корреляции.

(5)

При прямолинейной форме связи показатель тесноты связи определяется по формуле линейного коэффициента корреляции r:

(6)

Для оценки значимости коэффициента корреляции r применяется t-критерий Стьюдента с учетом заданного уровня значимости

и числа степеней свободы k.

Если

, то величина коэффициента корреляции признается существенной.

Для оценки значимости индекса корреляции R применяется F-критерий Фишера. Фактическое значение критерия FR определяется по формуле: