Смекни!
smekni.com

Процесс анализа информационных массивов (стр. 4 из 5)

Статистическую связь между двумя признаками можно изобразить графически. За x обозначается факторный признак, в данном случае себестоимость. За у обозначается результативный признак – выручка.

Рис. 2.1 Зависимость величины выручки от себестоимости

Линия, соединенная точками, называется «ломаная регрессии». Число точек ломаной регрессии соответствует числу предприятий.

Точнее определить наличие и тесноту связи можно с помощью различных показателей. Зная показатели, можно выявить те факторы, которые в данных конкретных условиях являются решающими и главным образом воздействуют на формирование величины результативного признака.

К показателям тесноты связи относится линейный коэффициент корреляции.

В статистической теории разработаны и на практике применяются различные модификации формул расчета данного коэффициента:

,(2.1)

где x– факторный признак;

y– результативный признак.

Выполнив несложные преобразования можно получить следующую формулу (2.2):

.(2.2)

При пользовании этой формулой отпадает необходимость вычислять отклонения индивидуальных значений признаков от средней величины, что исключает ошибку в расчетах при округлении средних величин.

Линейный коэффициент корреляции может принимать любые значения в пределах от -1 до +1. Чем ближе коэффициент корреляции по абсолютной величине к 1, тем теснее связь между признаками. Знак при линейном коэффициенте корреляции указывает на направление связи - прямой зависимости соответствует знак плюс, обратной – знак минус.

На основе данных таблицы 1.1(2.1), с помощью формулы (2.2), было определено два коэффициента корреляции.

Во-первых, коэффициент корреляции, показывающий степень тесноты связи между себестоимостью и выручкой от продаж.

Пусть x1 – величина себестоимости проданных товаров, продукции, работ, услуг. Тогда, y – величина выручки от продажи товаров, продукции, работ, услуг.

Отсюда r = 0,98, связь является прямой и очень сильной. Что значит, с увеличением себестоимости увеличивается и выручка.

Во-вторых, рассчитан коэффициент корреляции, показывающий степень тесноты связи между расходами и выручкой от продаж. В данной ситуации x2 – величина коммерческих и управленческих расходов, а y – величина выручки от продажи товаров, продукции, работ, услуг.

Коэффициент корреляции равен 0,66, что говорит о прямой связи между признаками.

Тесноту связи между факторными признаками можно также рассчитать по формуле (2.1), заменяя результативный признак на факторный:

.

(2.3)

= 0,51.

Полученная величина свидетельствует о наличии прямой зависимости между значениями себестоимости и расходов.

Для наглядности была построена матрица парных коэффициентов корреляции:

y – величина выручки от продажи товаров, продукции, работ, услуг;

x1 – величина себестоимости проданных товаров, продукции, работ, услуг;

x2 – величина коммерческих и управленческих расходов.

Таблица 2.2

Матрица парных коэффициентов корреляции

y x1 x2
y 1,00 0,98 0,66
x1 0,98 1,00 0,51
x2 0,66 0,51 1,00

Матрица парных коэффициентов корреляции показывает, что результативный показатель наиболее тесно связан с показателем x1.

Так как существует линейная связь между результативным и двумя факторными признаками, а также между парой факторных признаков, то имеет смысл рассчитать множественный коэффициент корреляции.

В данной работе множественный коэффициент корреляции был вычислен по формуле (2.4):

.(2.4)

= 0,99.

Связь между показателями сильная, факторы x1 и x2 практически полностью обуславливают величину y.

При построении модели связи, или регрессии, может возникнуть проблема мультиколлинеарности (наличие сильной корреляции между независимыми переменными, входящими в уравнение регрессии). Мультиколлинеарность существенно искажает результаты исследования.

Наиболее распространенный метод выявления коллинеарности основан на анализе парных коэффициентов корреляции. Он состоит в том, что две или несколько переменных признаются коллинеарными (мультиколлинеарными), если парные коэффициенты корреляции больше определенной величины. На практике наиболее часто считают, что два аргумента коллинеарны, если парный коэффициент корреляции между ними по абсолютной величине больше 0,8.

В данном примере парный коэффициент корреляции не превышает величины 0,8 (

= 0,51), что говорит об отсутствии явления мультиколлинеарности.

2.2 Построение модели связи и оценка ее существенности

Как было выяснено в предыдущем пункте, зависимость результативного признака от факторных является прямолинейной. Факторные признаки не являются мультиколлинеарными и практически полностью обуславливают результативный признак, следовательно, все признаки необходимо включить в модель. Поэтому связь будет описываться такой моделью связи (2.5):

,(2.5)

где

и
– коэффициенты регрессии.

Система нормальных уравнений:

(2.6)

Подставив данные из таблицы 2.1 в эту систему, получается:

Отсюда: a0= -2132,16; a1= 1,005433; a2=1,080124;

Расчеты показали, что с увеличением себестоимости проданных товаров, продукции, работ, услуг на 1 тыс. руб. и коммерческих, управленческих расходов на 1 тыс. руб. величина выручки от продажи возрастает соответственно в среднем на 1,0054 и 1,0801 тыс. руб.

Далее необходимо проверить адекватность модели, построенной на основе уравнений регрессии.

Во-первых, нужно проверить значимость каждого коэффициента регрессии. Значимость коэффициента регрессии осуществляется с помощью t-критерия Стьюдента (2.7):

,

(2.7)

где

-дисперсия коэффициента регрессии.

Параметр модели признается статистически значимым, если

tp > tkp(α; ν=n-k-1),

где α – уровень значимости;

ν – число степеней свободы.

Величина

может быть определена по формуле (2.8):

,(2.8)

где R– множественный коэффициент корреляции по y;

Ri– множественный коэффициент корреляции по фактору xi с остальными факторами.

В данной работе Ri=

, так как рассматриваются всего два факторных признака.

По формуле (2.8):

;

.

Теперь по формуле (2.7) определяются значения t-критерия.

;

.

Оба рассчитанных критерия превышают табличное значение, tkp= 2,12 (0,05; ν=16). Параметры модели являются статистически значимыми.

Во-вторых, проверяется адекватность уравнения регрессии с помощью расчета F-критерия Фишера (2.9):

.(2.9)

Гипотеза о незначимости коэффициента множественной корреляции (

= 0) отвергается, если
.

;

.

Гипотеза отклоняется, так как

. С вероятностью
можно сделать заключение о статистической значимости уравнения в целом и показателя тесноты связи
.