| Y\X | 5 | 10 | 15 | 20 | 25 | 30 | Ny |
| 35 | 4 | 2 | 6 | ||||
| 45 | 5 | 3 | 8 | ||||
| 55 | 5 | 45 | 5 | 55 | |||
| 65 | 2 | 8 | 7 | 17 | |||
| 75 | 4 | 7 | 3 | 14 | |||
| Nx | 4 | 7 | 10 | 57 | 19 | 3 | n=100 |
Найдем условные средние воспользовавшись формулами:
Үx=
Yx=5=
Yx=10=
Yx=15=
Yx=20=
Yx=25
Yx=30
Оценка тесноты линейной связи между признаками X и Y производится с помощью коэффициента линейной корреляции r:
Коэффициент r может принимать значения от -1 до +1.
Знак r указывает на вид связи: прямая или обратная. Абсолютная величина |r| на тесноту связи. При r>0 связь прямая, то есть с ростом х растет у.
При r<0 связь обратная, то есть с ростом х убывает у.
Для нахождения rвычислим указанные общие средние: х, у, ху, а также средние квадратические отклонения σх и σу. Вычисления удобно поместить в таблицах, куда вписываем также найденные ранее условные средние.
Значение коэффициента линейной корреляции
| Х | nx | x*nx | x2*nx | | |
| 5 | 4 | 20 | 100 | 35 | 700 |
| 10 | 7 | 70 | 700 | 42.14 | 2949.8 |
| 15 | 10 | 150 | 2250 | 54 | 8100 |
| 20 | 57 | 1140 | 22800 | 57.8 | 65892 |
| 25 | 19 | 475 | 11875 | 66.05 | 31373.75 |
| 30 | 3 | 90 | 2700 | 75 | 6750 |
| | 100 | 1945 | 40425 | - | 115765.55 |
| Y | ny | y*ny | y2*ny | | |
| 35 | 6 | 210 | 7350 | 6.67 | 1400.7 |
| 45 | 8 | 360 | 16200 | 11.875 | 4275 |
| 55 | 55 | 3025 | 166375 | 20 | 60500 |
| 65 | 17 | 1105 | 71825 | 21.47 | 23724.35 |
| 75 | 14 | 1050 | 78750 | 24.64 | 25872 |
| | 100 | 5750 | 340500 | - | 115772.05 |
С помощью таблиц находим общие средние, средние квадратов, среднюю произведения и среднеквадратические отклонения:
Х=
X2=
XY=
Y=
Y2=
Отсюда коэффициент корреляции равен:
r=
т.к r > 0, то связь прямая, то есть с ростом Х растет Y.
т.к | r | > 0,78 то линейная связь высокая.
Находим линейное уравнение регрессии Y по X:
Yx-57.5=0.78*
Yx=1.52x+27.94
Аналогично находим уравнение регрессии X поY:
Xy-19.45=0.78*
Xy=0.4y-3.55
Данные уравнения устанавливают связь между признаками X и Y и позволяют найти среднее значение признака Yx для каждого значения x и аналогично среднее значение признака Xyдля каждого значения y.
Изобразим полученные результаты графически.
| х | 5 | 30 |
| у | 35,54 | 73,54 |
Yx=1.52x+27.94
| х | 10,45 | 26,45 |
| у | 35 | 75 |
Обе прямые регрессии пересекаются в точке (х;у). В нашей задаче это точки (19,45; 57,5).
Оценка тесноты любой связи между признаками производится с помощью корреляционных отношений Y по X и X по Y:
ηух=
Дисперсия
Величины
Они характеризуют разброс условных средних, от общей средней. В данной задаче:
бх=
бу=
Тогда корреляционные отношения равны:
ηух=
ηху=
Ответ: Корреляционная связь между признаками высокая ее можно описать уравнениями:
Yx=1.52x+27.94,
Xy=0.4y-3.55.