Смекни!
smekni.com

Кореляційний і регресивний методи аналізу зв язку (стр. 2 из 2)

( a 0 S Y + a 1 SXY ) – (Y) 2

s2Ŷ =.

n

S( Y – Ŷx )

Залишку дисперсію визначають або за формулою s2 е =

n

або за правилом додавання дисперсій s2 е =s2 заг - s2 Ŷ .

У наведеному прикладі ( за даними розрахунків у табл..1 ) факторна дисперсія

( 0.167 · 47.2 + 0.421 · 539.1 ) - 4.72 2

s2 Ŷ = = 1.206.

10

Загальну дисперсію обчислимо за формулою

s2 заг = Y2 - ( Y )2 = 23.974 – 22.278 = 1.696.

Залишкову дисперсію визначаємо як різницю між загальною і факторною дисперсіями :

s2 е = s2 заг - s2Ŷ= 1.696 –1.206 = 0.409

Отже, знаходимо індекс кореляції за наведеними вище формулами :


s2 заг - s2 е 1.696 - 0.490

R = Ö = Ö= 0.843.

s2 заг 1.696

або s2 е0.490

R = Ö 1- = Ö1 - = 0.843

s2 заг 1.696

s2 Ŷ 1.206

або R= Ö = Ö=Ö0.711= 0.843

s2 заг 1.696

Індекс кореляції вказує на щільну залежність випуску продукції від вартості основних виробничих фондів.

Коефіцієнт детермінації ( R2 ) характеризує ту частину варіації результативної ознаки Y, яка відповідає лінійному рівнянню регресії :

s2Ŷ 1.206

R2 = = = 0.711

s2 заг 1.696

Отже, в обстеженій сукупності заводів 71.1% варіації випуску продукції пояснюється різними рівнями оснащеності заводів основними виробничими фондами.

Індекс кореляції набирає значень від 0 до 1. Коли R=0, то зв’язку між варіацією ознак YiX немає.Залишкова дисперсія дорівнює загальній, s2 е = s2 заг , а теоретична дисперсія дорівнює нулю, s2 заг= 0, Всі теоретичні значення YXзбігаються із середніми значеннями Y, лінія ŶXна графіку збігається з лінією Y, тобто набуває горизонтального положення .

При R=1 теоретична дисперсія дорівнює загальний,s2 Ŷ= s2 заг , а залишкова s2 е = 0.

Фактичні значення Y збігаеться з теоретичними ŶX , зв’язок між досліджуваними ознаками лінійно-функціональний.

Індекс кореляції оцінює щільність зв’язку.Він, як і емпіричне кореляційне відношення,вимірує лише щільність зв’язку і не вказує на її напрямок.

Аби доповнити дослідження визначенням напрямку зв’язку в разі лінійної залежності використовують лінійний коефіцієнт кореляції.

XY – X Y

r = .

sx sу

Значення rколивається в межах від – 1 до +1. Додатне значення відповідає прямову звязку між ознаками, а відємне – зворотному. Оцінюють щільність звязку за схемою ( табл. 1 )

Таблиця 2

Зв’язок Лінійний коефіцієнт кореляції
Прямий зв’язок Зворотний зв’язок

Слабкий

Середній

Щільний

0.1....0.30

0.3....0.70

0.7....0.99

- 0.1... - 0.30

- 0.3....- 0.70

- 0.7....- 0.99

Всі дані для обчислення лінійного коефіцієнта кореляції в наведеному прикладі є в табл.1.


sx= ÖХ2 - (Х)2 = Ö123.6 – 10.82 = Ö6.96 = 2.638

sy= ÖY2 - (Y)2 = Ö23.974 – 4.722 = 1.302

XY – XY 53.91 – 10.8 · 4.72 2.9340

r = = = = 0.854

sxsу 2.638 · 1.302 3.4349

Скористкємося для знаходження лінійного коефіцієнта кореляції іншою формулою:

sx2.638

r = а1= 0.421 · = 0.853,

sу 1.302

тобто відповідь вийшла ідентичною.Це означає,що зв’язок між вартістю основних виробничих фондів і випуском продукції сильний ( щільний ) і прямий.

Абсолютне значення лінійного коефіцієнта кореляції збугається з індексом кореляції ( відхилення становить 0.01 ).

Знаведених формул коефіцієнта кореляції можна визначити коефіцієнт регресії, не розраховуючи рівняння зв’язку:


XY – X Y 2.934

a1 = = = 0.421

s2x 6.960

або sy1.302

а1 = r= 0.853 · = 0.421.

sx2.638

Перевірку сили зв’язку в кореляційно-регресійному аналізі здійснюють за допомогою тих самих критеріїв і процедур,що й у аналітичному групуванні.Ступені вільності залежать від числа параметрів рівняння регресії k1 = m –1 і кількості одиниць дослуджіваної сукупності

k2 = n – m.

Істотність зв’язку коефіцієнта детермінації R2 перевіряють за допомогою таблиці критерію Fдля 5 % - го рівня значущості. Так, при k1 = m –1= 2 – 1 = 1 ( для лінійної моделі) і k2 = n – m = 10 – 2 = 8.

Фактичне значення F-критерію у наведеному вище прикладі визначають за формулою

R2 k2 0.711 8

F ф = = · = 19.68.

1 - R2 k11 – 0.711 1

Критичне значення Fт ( 0.95 ) = 5.32 набагато менше від фактичного Fт ( 0.95 ) ÐFф ( 5.32 Ð19.68) , що підтверджує істотність кореляційного зв’язку між досліджуваними ознаками.

Для встановлення достовірності обчисленого нами лінійного коефіцієнта кореляції використовують критерій Стьюдента ( t– критерій ):

r

tr = ,

mr

де mr- середня похибка коефіцієнта кореляції,яку визначають за формулою :

1 – r2

mr=

Ö n – 1

При достатньо великому числі спостережень ( n > 50) коефіцієнт кореляції можна вважати достовірним, якщо він перевищує свою похибку в три і більше разів, а якщо він менший ніж три, то зв’язок між досліджуваними ознаками XiY не доведено.

У наведеному прикладі середня похибка коефіцієнта кореляції

1 – r21 – 0.853 2 1 – 0.723 0.277

mr = = = = = 0.092

Ö n – 1Ö 9 3 3

Відношення коефіцієнта кореляції до його середньої похибки

0.853

tr = = 9.27

0.092

Це дає підставу вважати, що обчислений лінійний коефіцієнт кореляції достатньо точно характеризує щільність зв’язку між досліджуваними ознаками.