Обчисливши коефіцієнт кореляції можна отримати загальну уяву про спряження ознак які вивчаються.
Регресійний аналіз – наукове дослідження закономірностей між явищами, які залежать від багатьох факторів. Мета його – відшукати рівняння лінії, яка найбільш точно виражає залежність однієї ознаки від іншої. За формою регресія може бути прямолінійною і криволінійною, а за характером – простою, коли змінювання вислідної ознаки відбувається під зміною однієї факторіальної ознаки, і множинною, коли зміна обумовлена декількома факторіальними ознаками.
Регресивний аналіз дозволяє передбачити можливість зміни однієї ознаки на основі відомих змін другої шляхом розрахунку емпіричних формул, які показують, що зв’язок між ними існує.
При лінійній регресії залежність між ознаками виражається коефіцієнтом регресії, який показує в якому напрямку і на яку величину змінюється одна ознака при зміні другої на одиницю виміру.
Обчислюється коефіцієнт регресії за рівняннями:
Де
Коефіцієнти регресії мають знак коефіцієнта кореляції:
Ця властивість використовується для перевірки чи правильно обчислений коефіцієнт регресії.
Похибку коефіцієнтів регресії обчислюють за рівнянням:
Критерій суттєвості коефіцієнта регресії дорівнює критерію суттєвості коефіцієнта кореляції, тобто:
Часто залежність між признаками, які вивчаються буває криволінійною, вона може мати різні форми і описується відповідними рівняннями. В цьому випадку, головна задача регресійного аналізу полягає в тому, щоб по характеру розпреділення точок на графіку підібрати аналітичну залежність, яка описує закономірність зміни ознак. Після того, Як аналітична залежність підібрана, необхідно математичними перетвореннями привести її до рівняння прямої лінії, тобто перетворити вихідні дані і обчислити значення параметрів, які входять в аналітичну залежність. Приведення криволінійної залежності до рівняння прямої лінії дозволяє використати прийоми регресійного аналізу.
Приклад.
Техніку приведення кореляційного і регресійного аналізу розглянемо на прикладі для невеликого числа спостережень (
1. Розрахунки зручно вести складаючи таку таблицю.
Розрахунки допоміжних величин для обчислення кореляції і регресії
№пари | Значення ознаки | | | | |
| | ||||
123456789101112Сума | 19,920,926,129,430,540,344,847,855,658,364,576,6 | 0,00,61,11,21,71,72,63,44,25,86,37,3 | 396,01436,81681,21864,36930,251624,092007,042284,843091,363398,894160,255867,56 | 0,000,361,211,442,892,896,7611,5617,6433,6439,6953,29 | 0,0012,5428,7135,2851,8568,51116,48162,52233,52338,14406,35559,18 |
Розв’язання:
2. За даними таблиці обчислюємо шість допоміжних величин:
3. Обчислюється коефіцієнт кореляції, регресії і рівняння регресії:
коефіцієнт кореляції
коефіцієнт регресії
Рівняння регресії
Таким чином шукана залежність має вигляд:
4. Визначається похибка і критерій значущості для коефіцієнта кореляції:
Похибка коефіцієнта кореляції
критерій значущості коефіцієнта кореляції
5. Фактичне значення
6. За отриманим рівнянням регресії обчислюють теоретичне значення
Знайдені точки (
Парна залежність може бути апроксимована прямою лінією, параболою, гіперболою, логарифмічною, степеневою або показниковою функцією,поліномом і інше.
Рис. Вигляди основних ліній різних зв’язків між змінними величинами і їх рівняння.
1. Пряма, яка проходить через початок координат має рівняння
2. Пряма, що не проходить через початок координат має рівняння
3. Парабола з вершиною в початку координат і симетрична одній із осей має рівняння