( a 0 S Y + a 1 SXY ) – (Y) 2
s2Ŷ =.
n
S( Y – Ŷx )
Залишку дисперсію визначають або за формулою s2 е =
n
або за правилом додавання дисперсій s2 е =s2 заг - s2 Ŷ .
У наведеному прикладі ( за даними розрахунків у табл..1 ) факторна дисперсія
( 0.167 · 47.2 + 0.421 · 539.1 ) - 4.72 2
s2 Ŷ = = 1.206.
10
Загальну дисперсію обчислимо за формулою
s2 заг = Y2 - ( Y )2 = 23.974 – 22.278 = 1.696.
Залишкову дисперсію визначаємо як різницю між загальною і факторною дисперсіями :
s2 е = s2 заг - s2Ŷ= 1.696 –1.206 = 0.409
Отже, знаходимо індекс кореляції за наведеними вище формулами :
s2 заг - s2 е 1.696 - 0.490
R = Ö = Ö= 0.843.
s2 заг 1.696
або s2 е0.490
R = Ö 1- = Ö1 - = 0.843
s2 заг 1.696
s2 Ŷ 1.206
або R= Ö = Ö=Ö0.711= 0.843
s2 заг 1.696
Індекс кореляції вказує на щільну залежність випуску продукції від вартості основних виробничих фондів.
Коефіцієнт детермінації ( R2 ) характеризує ту частину варіації результативної ознаки Y, яка відповідає лінійному рівнянню регресії :
s2Ŷ 1.206
R2 = = = 0.711
s2 заг 1.696
Отже, в обстеженій сукупності заводів 71.1% варіації випуску продукції пояснюється різними рівнями оснащеності заводів основними виробничими фондами.
Індекс кореляції набирає значень від 0 до 1. Коли R=0, то зв’язку між варіацією ознак YiX немає.Залишкова дисперсія дорівнює загальній, s2 е = s2 заг , а теоретична дисперсія дорівнює нулю, s2 заг= 0, Всі теоретичні значення YXзбігаються із середніми значеннями Y, лінія ŶXна графіку збігається з лінією Y, тобто набуває горизонтального положення .
При R=1 теоретична дисперсія дорівнює загальний,s2 Ŷ= s2 заг , а залишкова s2 е = 0.
Фактичні значення Y збігаеться з теоретичними ŶX , зв’язок між досліджуваними ознаками лінійно-функціональний.
Індекс кореляції оцінює щільність зв’язку.Він, як і емпіричне кореляційне відношення,вимірує лише щільність зв’язку і не вказує на її напрямок.
Аби доповнити дослідження визначенням напрямку зв’язку в разі лінійної залежності використовують лінійний коефіцієнт кореляції.
XY – X Y
r = .
sx sу
Значення rколивається в межах від – 1 до +1. Додатне значення відповідає прямову зв’язку між ознаками, а від’ємне – зворотному. Оцінюють щільність зв’язку за схемою ( табл. 1 )
Таблиця 2
Зв’язок | Лінійний коефіцієнт кореляції | |
Прямий зв’язок | Зворотний зв’язок | |
Слабкий Середній Щільний | 0.1....0.30 0.3....0.70 0.7....0.99 | - 0.1... - 0.30 - 0.3....- 0.70 - 0.7....- 0.99 |
Всі дані для обчислення лінійного коефіцієнта кореляції в наведеному прикладі є в табл.1.
sx= ÖХ2 - (Х)2 = Ö123.6 – 10.82 = Ö6.96 = 2.638
sy= ÖY2 - (Y)2 = Ö23.974 – 4.722 = 1.302
XY – XY 53.91 – 10.8 · 4.72 2.9340
r = = = = 0.854
sxsу 2.638 · 1.302 3.4349
Скористкємося для знаходження лінійного коефіцієнта кореляції іншою формулою:
sx2.638
r = а1= 0.421 · = 0.853,
sу 1.302
тобто відповідь вийшла ідентичною.Це означає,що зв’язок між вартістю основних виробничих фондів і випуском продукції сильний ( щільний ) і прямий.
Абсолютне значення лінійного коефіцієнта кореляції збугається з індексом кореляції ( відхилення становить 0.01 ).
Знаведених формул коефіцієнта кореляції можна визначити коефіцієнт регресії, не розраховуючи рівняння зв’язку:
XY – X Y 2.934
a1 = = = 0.421
s2x 6.960
або sy1.302
а1 = r= 0.853 · = 0.421.
sx2.638
Перевірку сили зв’язку в кореляційно-регресійному аналізі здійснюють за допомогою тих самих критеріїв і процедур,що й у аналітичному групуванні.Ступені вільності залежать від числа параметрів рівняння регресії k1 = m –1 і кількості одиниць дослуджіваної сукупності
k2 = n – m.
Істотність зв’язку коефіцієнта детермінації R2 перевіряють за допомогою таблиці критерію Fдля 5 % - го рівня значущості. Так, при k1 = m –1= 2 – 1 = 1 ( для лінійної моделі) і k2 = n – m = 10 – 2 = 8.
Фактичне значення F-критерію у наведеному вище прикладі визначають за формулою
R2 k2 0.711 8
F ф = = · = 19.68.
1 - R2 k11 – 0.711 1
Критичне значення Fт ( 0.95 ) = 5.32 набагато менше від фактичного Fт ( 0.95 ) ÐFф ( 5.32 Ð19.68) , що підтверджує істотність кореляційного зв’язку між досліджуваними ознаками.
Для встановлення достовірності обчисленого нами лінійного коефіцієнта кореляції використовують критерій Стьюдента ( t– критерій ):
r
tr = ,
mr
де mr- середня похибка коефіцієнта кореляції,яку визначають за формулою :
1 – r2
mr=
Ö n – 1
При достатньо великому числі спостережень ( n > 50) коефіцієнт кореляції можна вважати достовірним, якщо він перевищує свою похибку в три і більше разів, а якщо він менший ніж три, то зв’язок між досліджуваними ознаками XiY не доведено.
У наведеному прикладі середня похибка коефіцієнта кореляції
1 – r21 – 0.853 2 1 – 0.723 0.277
mr = = = = = 0.092
Ö n – 1Ö 9 3 3
Відношення коефіцієнта кореляції до його середньої похибки
0.853
tr = = 9.27
0.092
Це дає підставу вважати, що обчислений лінійний коефіцієнт кореляції достатньо точно характеризує щільність зв’язку між досліджуваними ознаками.