НЕПАРАМЕТРИЧНІ МЕТОДИ ОЦІНКИ ТІСНОТИ ЗВ`ЯЗКУ
План
1. Критерії Спірмена та Кендала
3. Коефіцієнти асоціації і контингенції
4. Коефіцієнт взаємної спряженості Пірсона і Чупрова
Серед непараметричних (емпіричних) методів оцінки тісноти зв’язку найбільше значення мають розрахунки рангових коефіцієнтів Спірмена
і Кендала .Ці коефіцієнти можуть бути використанні для визначення тісноти зв’язку як між кількісними, так і між якісними ознаками при умові, якщо значення цих показників можуть бути впорядковані або проранговані по спаданню або зростанню ознаки.
Для визначення рангового коефіцієнта кореляції рангують (тобто записують у зростаючому або спадаючому порядку) всі значення факторної ознаки
і разом з тим записують відповідні значення результативної ознаки . Другими словами, визначають ранг по обох ознаках, тобто номер кожної ознаки в рангових рядах.Ступінь тісноти зв’язку між ознаками визначається ранговим коефіцієнтом кореляції Спірмена по формулі:
де
- квадрати різниць рангів зв’язаних величин і ; п - число спостережень (число пар рангів).У випадку відсутності зв’язку
; при прямому зв’язку коефіцієнт додатній, а при оберненому зв’язку - від’ємний.Приклад 1. Визначити, чи існує залежність між стажем роботи та виробітком робітника для слідуючих даних:
Таблиця 1
№ п/п | Стаж роботи робітників, х, роки | Виробіток на 1 робітника, у |
1 | 2,5 | 222 |
2 | 2,5 | 223 |
3 | 1 | 200 |
4 | 1 | 202 |
5 | 1 | 205 |
6 | 5 | 244 |
7 | 5 | 250 |
8 | 3 | 234 |
9 | 4,5 | 241 |
10 | 4,4 | 244 |
11 | 2,7 | 230 |
Рішення.
Фактори
і ранжуємо (впорядкуємо) в порядку зростання (спадання) їх значень і заповнюємо табл. 2.Таблиця 2
Ранг ознаки х | Ранг ознаки у | Рангова різниця | |||
1 | 200 | 4 | 3 | 1 | 1 |
1 | 202 | 4 | 4 | 0 | 0 |
1 | 205 | 4 | 5 | -1 | 1 |
2,5 | 222 | 1,5 | 1 | 0,5 | 0,25 |
2,5 | 223 | 1,5 | 2 | -0,5 | 0,25 |
2,7 | 230 | 11 | 11 | 0 | 0 |
3 | 234 | 8 | 8 | 0 | 0 |
4,4 | 241 | 10 | 9 | 1 | 1 |
4,5 | 244 | 9 | 8 | 1 | 1 |
5 | 244 | 6,5 | 8 | -1,5 | 2,25 |
5 | 250 | 6,5 | 7 | -0,5 | 0,25 |
Всього | 3,5-3,5=0 | 7 |
Визначаємо ранги по обох ознаках, тобто номер кожної ознаки в рангованих рядах. Для рівних значень факторів х та у ранг знаходять шляхом ділення суми рангів, що приходяться на неї, на число рівних значень.
3. Знаходимо рангову різницю
та .4. Розрахуємо коефіцієнт кореляції рангів Спірмена:
Розрахунок рангового коефіцієнта Кендала відбувається за формулою:
де п - число спостережень; S - сума додатних та від’ємних балів по одній із зв’язаних величин, ранги котрої розміщені у відповідності з впорядкованими рангами другої.
Одним із найпростіших показників кореляційної залежності, пов’язаний з іменем відомого німецького вченого психофізика Фехнера.
Коефіцієнт Фехнера базується на застосуванні перших ступенів відхилень всіх значень взаємозв’язаних ознак від середньої величини по кожній ознаці.
Коефіцієнт Фехнера вимірює тісноту зв’язку за наступною формулою:
де
- число збігів та незбігів знаків відхилень значень фактичної і результативної ознак від своїх середніх, тобто При цьому фіксуються збіги та незбіги знаків в відхиленнях від середньої у різних пар значень ознак.Коефіцієнт Фехнера К змінюється в межах від - 1 до +1. Якщо зв’язок між ознаками обернений, то К від’ємний; у випадку прямого зв’язку - додатній. Чим ближче К до
, тим зв’язок більш тісний.Приклад 2. Розрахувати коефіцієнт Фехнера для наступних даних:
Таблиця 3
Стаж роботи, х | Виробіток на 1 робітника, у | Збіг чи незбіг знаків | ||
2,5 | - | 222 | - | С |
2,5 | - | 223 | - | С |
1 | - | 200 | - | С |
1 | - | 202 | - | С |
1 | - | 205 | - | С |
5 | + | 244 | + | С |
5 | + | 250 | + | С |
3 | + | 234 | + | С |
4,5 | + | 241 | + | С |
4,5 | + | 244 | + | С |
2,7 | - | 230 | + | Н |
Коефіцієнт Фехнера
Величина К досить близька до величини коефіцієнта рангової кореляції Спірмена, що свідчить про тісний зв’язок між ознаками х і у.
Для визначення тісноти зв’язку двох якісних ознак, кожна із котрих складається тільки із двох груп, використовують коефіцієнти асоціації і контингенції. Для їх розрахунку будується чотирьохклітинна таблиця кореляції, котра виражає зв’язок між двома явищами, кожне із них в свою чергу повинно бути альтернативним, тобто складається із двох якісно відмінних друг від друга значень ознаки (наприклад, хороший, поганий).
Наприклад, при вивчені залежності врожайності від кількості внесених в ґрунт добрив виділимо по врожайності і по кількості внесених добрив лише по дві групи. При цій умові можна побудувати наступну чотирьохклітинну таблицю.
Таблиця 4
УдобреноУрожайність | Добре | Погано | Всього |
Висока | а | в | a+b |
Низька | с | d | c+d |
Всього | а+c | b+d |
Числа, які стоять на перетині рядків і граф a, в, c, d показують, скільки дільниць зустрічаються з тою або другою кількістю добрив, що внесені в ґрунт, з тією або другою врожайністю.
Коефіцієнт асоціації Юла і коефіцієнт контингенції розраховується за наступними формулами:
асоціації Юла
;контингенції
.де a, в, c, d - кількісні характеристики досліджувальних груп.
Коефіцієнт контингенції завжди менший коефіцієнта асоціації Юла. Зв’язок рахується підтвердженим, якщо:
або .Приклад 3. Дослідити зв’язок між виконанням норм виробітку молодими робітниками і закінченням ними середньої школи. Результати обстеження характеризуються даними (табл. 5).
Таблиця 5
Групи робітників | Виконують норму | Не виконують норму | Всього |
Закінчили середню школу | 78 | 22 | 100 |
Не закінчили середню школу | 32 | 68 | 100 |
Всього | 110 | 90 | 200 |
Рішення. За даними таблиці
Між досліджувальними ознаками спостерігається чіткий зв’язок, що підтверджується досить високими значеннями коефіцієнтів асоціації і контингенції.