4. Линейный коэффициент корреляции применяется в случае линейной зависимости между двумя количественными признаками x и y. В отличие от КФ в линейном коэффициенте корреляции учитываются не только знаки отклонений от средних величин, но и значения самих отклонений, выраженные для сопоставимости в единицах среднего квадратического отклонения t:
Линейный коэффициент корреляции r представляет собой среднюю величину из произведений нормированных отклонений для x и у:
Числитель формулы (84), деленный на n, т.е.
Линейный коэффициент корреляции может принимать значения от –1 до +1, причем знак определяется в ходе решения. Например, если
В нашей задаче для расчета r построим вспомогательную таблицу 11.
Таблица 11. Вспомогательные расчеты линейного коэффициента корреляции
i | xi | yi | | | tx | ty | tx ty | | |
1 | 12 | 28 | 1600 | 5184 | -1,36526 | -1,10032 | 1,502223 | 288 | 33,6 |
2 | 16 | 40 | 1296 | 3600 | -1,22873 | -0,91693 | 1,126667 | 216 | 64 |
3 | 25 | 38 | 729 | 3844 | -0,92155 | -0,9475 | 0,873167 | 167,4 | 95 |
4 | 38 | 65 | 196 | 1225 | -0,47784 | -0,53488 | 0,255587 | 49 | 247 |
5 | 43 | 80 | 81 | 400 | -0,30718 | -0,30564 | 0,093889 | 18 | 344 |
6 | 55 | 101 | 9 | 1 | 0,102394 | 0,015282 | 0,001565 | 0,3 | 555,5 |
7 | 60 | 95 | 64 | 25 | 0,273052 | -0,07641 | -0,02086 | -4 | 570 |
8 | 80 | 125 | 784 | 625 | 0,955681 | 0,382056 | 0,365124 | 70 | 1000 |
9 | 91 | 183 | 1521 | 6889 | 1,331128 | 1,268425 | 1,688436 | 323,7 | 1665,3 |
10 | 100 | 245 | 2304 | 21025 | 1,638311 | 2,215924 | 3,630373 | 696 | 2450 |
Итого | 520 | 1000 | 8584 | 42818 | 9,516166 | 1824,4 | 7024,4 |
В нашей задаче:
Проверка коэффициента корреляции на значимость (существенность). Интерпретируя значение коэффициента корреляции, следует иметь в виду, что он рассчитан для ограниченного числа наблюдений и подвержен случайным колебаниям, как и сами значения x и y, на основе которых он рассчитан. Другими словами, как любой выборочный показатель, он содержит случайную ошибку и не всегда однозначно отражает действительно реальную связь между изучаемыми показателями. Для того, чтобы оценить существенность (значимость) самого r и, соответственно, реальность измеряемой связи между х и у, необходимо рассчитать среднюю квадратическую ошибку коэффициента корреляции σr. Оценка существенности (значимости) r основана на сопоставлении значения r с его средней квадратической ошибкой:
Существуют некоторые особенности расчета σr в зависимости от числа наблюдений (объема выборки) – n.
1. Если число наблюдений достаточно велико (n>30), то σr рассчитывается по формуле (86):
Обычно, если
2. Если число наблюдений небольшое (n<30), то σr рассчитывается по формуле (87):
а значимость r проверяется на основе t-критерия Стьюдента, для чего определяется расчетное значение критерия по формуле (88) и сопоставляется c tТАБЛ.
Табличное значение tТАБЛ находится по таблице распределения t-критерия Стьюдента (см. приложение 2) при уровне значимости α=1-β и числе степеней свободы ν=n–2. Если tРАСЧ> tТАБЛ , то r считается значимым, а связь между х и у – реальной. В противном случае (tРАСЧ< tТАБЛ) считается, что связь между х и у отсутствует, и значение r, отличное от нуля, получено случайно.