Ранговий коефіцієнт кореляції Спирмена
, як і звичайний коефіцієнт кореляції, характеризує залежність між вибірками випадкових величин. Вибірковим значенням рангового коефіцієнта кореляції Спирмена називають величину (4.1)Коефіцієнт
– непараметрична міра залежності між і .Гіпотеза
при альтернативній гіпотезі перевіряється за допомогою статистики (4.2)Якщо
, то гіпотеза відхиляється (тобто між і існує рангова кореляційна залежність), і не відхиляється в противному випадку. Рівень значимості критерію .Порахуємо коефіцієнт Спирмена між Xi і Y в таблиці 2.1 з використанням спеціалізованої програми «Статистика».
N – обсяг вибірок
Spearman R – коефіцієнт рангової кореляції Спирмена
t (N‑2) – статистика
для перевірки гіпотезиp-level – р-уровень
Тому що
, то гіпотеза відхиляється (або, що те ж р-level<0,05, тому гіпотеза відхиляється).Ранговий кореляційний зв'язок між Xi і Y є значимим.
Порахуємо коефіцієнт Спирмена між Xj і Y в таблиці 2.1 з використанням спеціалізованої програми «Статистика».
Тому що
, то гіпотеза відхиляється (або, що те ж р-level<0,05, тому гіпотеза відхиляється).Ранговий кореляційний зв'язок між Xj і Y є значимим.
На основі наведених даних спостережень будуються лінійна одновимірні Y=f(Xi) та багатовимірні Y=f (Xi, Xj) регресійні моделі, які встановлюютьє залежність результативної ознаки Y – середньорічного рівня надою молока від факторних ознак – Xi (кількості кормів на одну корову) та Xj (рівня приплоду телят на 100 корів) по 30 хазяйствам.
Одновимірна лінійна регресійна модель представляється як:
, (4.3)де
– постійна складова доходу (початок відліку); – коефіцієнт регресії; – відхилення фактичних значень надою від оцінки (математичного сподівання) середньої величини надою в і-тому хазяйстві.Існують різні способи оцінювання параметрів регресії. Найпростішим, найуніверсальнішим є метод найменших квадратів [48]. За цим методом параметри визначаються виходячи з умови, що найкраще наближення, яке мають забезпечувати параметри регресії, досягається, коли сума квадратів різниць
між фактичними значеннями доходу та його оцінками є мінімальною, що можна записати як . (4.4)Відмітимо, що залишкова варіація (4.4) є функціоналом
від параметрів регресійного рівняння: (4.5)За методом найменших квадратів параметри регресії
і є розв’язком системи двох нормальних рівнянь [48]:Розв’язок цієї системи має вигляд:
, (4.7) .Середньоквадратична помилка регресії, знаходиться за формулою
, (4.8)Коефіцієнт детермінації для даної моделі
(4.9)повинен дорівнювати:
>0,75 – сильний кореляційний зв’зок, 0,36> >0,75 – кореляційний зв’язок середньої щільності; <0,36 – кореля-ційній зв’язок низької щільності [48].Для характеристики кореляційного зв’язку між факторною і результативною ознаками побудуємо графік кореляційного поля та теоретичну лінію регресії, визначимо параметри лінійного рівняння регресії.
Для перевірки істотності зв’язку потрібно порівняти фактичне значення статистики Фішера (F-критерій) з його критичним (табличним) значенням, яке потрібно визначити з урахуванням умов аналітичного групування і заданого рівня істотності, скориставшись таблицею.
При виконанні процедури перевірки значущості коефіцієнта детермінації висувається нульова гіпотеза H0проти альтернативи H1, котрі полягають в наступному:
H0: істотної різниці між вибірковим коефіцієнтом детермінації та коефіцієнтом детермінації генеральної сукупності не існує. Ця гіпотеза рівносильна гіпотезі H0:b=0, тобто змінні X не впливають суттєво на залежну змінну Y. Для оцінки істотності коефіцієнта детермінації використовується статистика:
(4.10)що має F-розподіл Фішера з f1=1 та f2=n‑2=30–2=28 ступенями вільності.
Значення статистики порівнюється з критичним значенням цієї статистики, знайденим за таблицею при заданому рівні значущості a=0,05 та відповідному числі ступенів вільності. Якщо F>F1,n-2,a, то обчислений коефіцієнт детермінації істотно відрізняється від нуля. Цей висновок забезпечується з ймовірністю 1-a. Рівень істотності a=0,05. Кількість ступенів вільності наступна: f1=1, f2=28.
Для лінійного зв’язку використовується лінійний коефіцієнт кореляції (Пірсона):
(4.11)який набуває значень у межах +-1, тому характеризує не лише щільність, а й напрямок зв’язку. Додатне значення свідчить про прямий зв’язок, а від’ємне – про зворотний.
Щільність зв’язку оцінюється індексом детермінації: R=
, проте інтерпретується тільки R2. Якщо коефіцієнт детермінації більше 0,6, то 60% варіації залежної величини пояснюється варіацією незалежного параметра кореляції і зв’язок є щільним.На рис. 3.1 – 3.4 наведені лінійні та нелінійні регресійні одномірні моделі кореляційного зв’язку Y=F(Xi) та Y=f(Xj).Як видно з графіків рис. 3.1 – 3.2 коефіцієнт детермінації R2 для лінійної кореляції знаходиться в діапазоні 0,35 – 0,5, тобто лінійний одномірний кореляційний зв’язок є слабої сили. При побудові нелінійних одномірних рівнянь регресії (рис. 3.3 – 3.4) коефіцієнт детермінації R2 для нелінійної кореляції знаходиться в діапазоні 0,5 – 0,7, тобто нелінійний одномірний кореляційний зв’язок є сильним.