Смекни!
smekni.com

Статистика вивчення продуктивності великої рогатої худоби (стр. 4 из 6)

Ранговий коефіцієнт кореляції Спирмена

, як і звичайний коефіцієнт кореляції, характеризує залежність між вибірками випадкових величин. Вибірковим значенням рангового коефіцієнта кореляції Спирмена
називають величину

(4.1)

Коефіцієнт

– непараметрична міра залежності між
і
.

Гіпотеза

при альтернативній гіпотезі
перевіряється за допомогою статистики

(4.2)

Якщо

, то гіпотеза
відхиляється (тобто між
і
існує рангова кореляційна залежність), і не відхиляється в противному випадку. Рівень значимості критерію
.

Порахуємо коефіцієнт Спирмена між Xi і Y в таблиці 2.1 з використанням спеціалізованої програми «Статистика».

N – обсяг вибірок

Spearman R – коефіцієнт рангової кореляції Спирмена

t (N‑2) – статистика

для перевірки гіпотези

p-level – р-уровень

Тому що

, то гіпотеза
відхиляється (або, що те ж р-level<0,05, тому гіпотеза відхиляється).

Ранговий кореляційний зв'язок між Xi і Y є значимим.

Порахуємо коефіцієнт Спирмена між Xj і Y в таблиці 2.1 з використанням спеціалізованої програми «Статистика».

Тому що

, то гіпотеза
відхиляється (або, що те ж р-level<0,05, тому гіпотеза відхиляється).

Ранговий кореляційний зв'язок між Xj і Y є значимим.

На основі наведених даних спостережень будуються лінійна одновимірні Y=f(Xi) та багатовимірні Y=f (Xi, Xj) регресійні моделі, які встановлюютьє залежність результативної ознаки Y – середньорічного рівня надою молока від факторних ознак – Xi (кількості кормів на одну корову) та Xj (рівня приплоду телят на 100 корів) по 30 хазяйствам.

Одновимірна лінійна регресійна модель представляється як:

, (4.3)

де

– постійна складова доходу
(початок відліку);

– коефіцієнт регресії;

– відхилення фактичних значень надою
від оцінки (математичного сподівання)
середньої величини надою в і-тому хазяйстві.

Існують різні способи оцінювання параметрів регресії. Найпростішим, найуніверсальнішим є метод найменших квадратів [48]. За цим методом параметри визначаються виходячи з умови, що найкраще наближення, яке мають забезпечувати параметри регресії, досягається, коли сума квадратів різниць

між фактичними значеннями доходу та його оцінками є мінімальною, що можна записати як

. (4.4)

Відмітимо, що залишкова варіація (4.4) є функціоналом

від параметрів регресійного рівняння:

(4.5)

За методом найменших квадратів параметри регресії

і
є розв’язком системи двох нормальних рівнянь [48]:

, (4.6)

.

Розв’язок цієї системи має вигляд:

, (4.7)

.

Середньоквадратична помилка регресії, знаходиться за формулою

, (4.8)

Коефіцієнт детермінації для даної моделі

(4.9)

повинен дорівнювати:

>0,75 – сильний кореляційний зв’зок, 0,36>
>0,75 – кореляційний зв’язок середньої щільності;
<0,36 – кореля-ційній зв’язок низької щільності [48].

Для характеристики кореляційного зв’язку між факторною і результативною ознаками побудуємо графік кореляційного поля та теоретичну лінію регресії, визначимо параметри лінійного рівняння регресії.

Для перевірки істотності зв’язку потрібно порівняти фактичне значення статистики Фішера (F-критерій) з його критичним (табличним) значенням, яке потрібно визначити з урахуванням умов аналітичного групування і заданого рівня істотності, скориставшись таблицею.

При виконанні процедури перевірки значущості коефіцієнта детермінації висувається нульова гіпотеза H0проти альтернативи H1, котрі полягають в наступному:

H0: істотної різниці між вибірковим коефіцієнтом детермінації та коефіцієнтом детермінації генеральної сукупності не існує. Ця гіпотеза рівносильна гіпотезі H0:b=0, тобто змінні X не впливають суттєво на залежну змінну Y. Для оцінки істотності коефіцієнта детермінації використовується статистика:

(4.10)

що має F-розподіл Фішера з f1=1 та f2=n‑2=30–2=28 ступенями вільності.

Значення статистики порівнюється з критичним значенням цієї статистики, знайденим за таблицею при заданому рівні значущості a=0,05 та відповідному числі ступенів вільності. Якщо F>F1,n-2,a, то обчислений коефіцієнт детермінації істотно відрізняється від нуля. Цей висновок забезпечується з ймовірністю 1-a. Рівень істотності a=0,05. Кількість ступенів вільності наступна: f1=1, f2=28.

Для лінійного зв’язку використовується лінійний коефіцієнт кореляції (Пірсона):

(4.11)

який набуває значень у межах +-1, тому характеризує не лише щільність, а й напрямок зв’язку. Додатне значення свідчить про прямий зв’язок, а від’ємне – про зворотний.

Щільність зв’язку оцінюється індексом детермінації: R=

, проте інтерпретується тільки R2. Якщо коефіцієнт детермінації більше 0,6, то 60% варіації залежної величини пояснюється варіацією незалежного параметра кореляції і зв’язок є щільним.

На рис. 3.1 – 3.4 наведені лінійні та нелінійні регресійні одномірні моделі кореляційного зв’язку Y=F(Xi) та Y=f(Xj).Як видно з графіків рис. 3.1 – 3.2 коефіцієнт детермінації R2 для лінійної кореляції знаходиться в діапазоні 0,35 – 0,5, тобто лінійний одномірний кореляційний зв’язок є слабої сили. При побудові нелінійних одномірних рівнянь регресії (рис. 3.3 – 3.4) коефіцієнт детермінації R2 для нелінійної кореляції знаходиться в діапазоні 0,5 – 0,7, тобто нелінійний одномірний кореляційний зв’язок є сильним.