Наиболее простыми методом определения коэффициента корреляции являются ранговая корреляция:
, где - коэффициент ранговой корреляции, d - разность рангов, n –число сопоставляемых пар признаков.При ранговой корреляции числовые выражения сравниваемых статистических рядов ранжируют, то есть проставляют ранговые номера для каждой цифры (от 1 и далее) и подставляют значения в формулу с учетом разницы порядковых значений. При расчете коэффициента корреляции методом квадратов (метод Пирсона) сначала вычисляют среднее значение в каждом вариационном ряду сравниваемых групп. Затем находят отклонение каждой величины ряда от полученной средней. Для устранения отрицательных значений эти величины возводят в квадрат и подставляют в формулу: rxy = , где dx и dy – отклонение каждой варианты от своей средней арифметической Мх и Мy. По величине коэффициента устанавливают направление и силу связи. Достоверность коэффициента определяют по таблицам критических значений (таблицам Каминского) при n’ = n-2 (приложение, табл. 4), а также при расчете средней ошибки и критерия достоверности t. Коэффициент корреляции должен превышать свою ошибку не менее чем в 3 раза.Формула ошибки коэффициента ранговой корреляции: m = , t = По методу Пирсона ошибка коэффициента корреляции вычисляется по формуле: mr = , , t = . Значения t оценивается по таблице критических значений критерия t (при n<30, приложение, табл. 2).ЗАДАНИЕ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ:
ЗАДАНИЕ 1: Вычислить коэффициент ранговой корреляции, определить направление и силу корреляционной связи, оценить достоверность полученных данных
Задача 1.
Существует ли связь между стажем работы на машиностроительном предприятии и показателями заболеваемости рабочих?
Стаж работы | До 1 года | 1-3 года | 4-5 лет | 6-10 лет | 11-15 лет | 16-20 лет | 21-25 лет | 26 и более |
Число случаев заболеваний на 100 рабочих | 59,6 | 41,9 | 40,8 | 64,7 | 64,7 | 77,5 | 83,6 | 112,8 |
Задача 2.
Существует ли связь между возрастом заболевших гриппом и уровнем смертности от этого заболевания?
Возраст заболевших в годах | До 1 года | 1-4 | 5-9 | 10-14 | 15-17 | 18-20 | 21-30 | 31-40 | 41-50 | 51-60 | 61 и старше |
Смертность на 100000 человек | 68,3 | 57,7 | 55,9 | 24,7 | 55,9 | 42,1 | 67,9 | 86,6 | 89,4 | 106,7 | 158,2 |
Задача 3.
Существует ли связь между возрастом мужчин и уровнем смертности
Возраст в годах | 0-4 | 5-9 | 10-14 | 15-24 | 25-34 | 35-44 | 45-54 | 55-64 | 65 и старше |
Уровень смертности на 100000 человек | 801,0 | 272,0 | 194,7 | 296,8 | 624,1 | 922,8 | 2624,4 | 4324,5 | 9275,1 |
Задача 4.
Существует ли связь между долей контингента часто болеющих (ЧБ) и возрастом детей
Возраст в годах | До 1 года | 1-2 | 3-4 | 5-6 | 7-8 | 9-10 | 11-12 | 13-14 |
Доля ЧБ | 28,5 | 48,2 | 44,9 | 38,7 | 38,7 | 27,9 | 24,2 | 20,1 |
Задача 5.
Существует ли связь между возрастом и частотой нарушения зрения у детей
Возраст в годах | 0-3 | 4-5 | 6-7 | 8-9 | 10-11 | 12-13 | 14-15 | 16-17 |
Нарушения зрения, ‰ | 18,9 | 20,7 | 31,4 | 42,7 | 42,1 | 54,6 | 54,6 | 92,0 |
Задача 6.
Существует ли связь между порядковым номером месяца года и частотой обращения населения за скорой и неотложной медицинской помощью по поводу сердечно-сосудистых заболеваний
Месяц | январь | февраль | март | апрель | май | июнь | июль | август | сентябрь | октябрь | ноябрь | декабрь |
Частота обращений за СНМП ‰ | 114,3 | 108,3 | 109,7 | 103,2 | 104,5 | 95,2 | 98,4 | 97,8 | 87,6 | 92,7 | 92,7 | 96,4 |
Задача 7.
Существует ли связь между расстоянием от места жительства до предприятия и заболеваемостью рабочих
Расстояние в метрах | До 500 м. | 600-1000 | 1100-3000 | 3100-4000 | 4100-5000 | 5100-7000 | 7100-9000 | 9100 и более |
Заболеваемость ‰ | 920,1 | 887,9 | 920,1 | 954,0 | 1286,3 | 1107,8 | 1510,8 | 1832,7 |
Задача 8.
Существует ли связь между временем прошедшим от возникновения острого приступа холецистита до начала проведения операции и частотой послеоперационных осложнений
Время в часах | До 3 часов | 3-5 | 6-8 | 9-11 | 12-14 | 15-17 | 18-20 | 21-23 | 24 и более |
Частота осложнений в % | 8 | 8 | 12 | 19 | 20 | 24 | 21 | 35 | 46 |
Задача 9.