yi — выборочные данные, а fi — соответствующие им значения модели.
Также это квадрат корреляции Пирсона между двумя переменными. Он выражает количество дисперсии, общей между двумя переменными.
Коэффициент принимает значения из интервала [0;1]. Чем ближе значение к 1 тем ближе модель к эмпирическим наблюдениям.
В случае парной линейной регрессионной модели коэффициент детерминации равен квадрату коэффициента корреляции, то есть R2 = r2.
Иногда показателям тесноты связи можно дать качественную оценку (шкала Чеддока) (приложение 3).
Функциональная связь возникает при значении равном 1, а отсутствие связи — 0. При значениях показателей тесноты связи меньше 0,7 величина коэффициента детерминации всегда будет ниже 50 %. Это означает, что на долю вариации факторных признаков приходится меньшая часть по сравнению с остальными неучтенными в модели факторами, влияющими на изменение результативного показателя. Построенные при таких условиях регрессионные модели имеют низкое практическое значение.
Выводы
В настоящее время регрессионный анализ используется как в естественнонаучных исследованиях, так и в обществоведении.
Уравнение регрессии позволяет найти значение зависимой переменной, если величина независимой или независимых переменных известна.
Практически, речь идет о том, чтобы, анализируя множество точек на графике (т.е. множество статистических данных), найти линию, по возможности точно отражающую заключенную в этом множестве закономерность (тренд, тенденцию), линию регрессии.
Задачи регрессионного анализа лежат в сфере установления формы зависимости, определения функции регрессии, использования уравнения для оценки неизвестных значений зависимой переменной.
Решение задач основывается на анализе соответствующих параметров (статистических данных) в которых всегда неизбежно присутствуют отклонения, вызванные случайными ошибками. Поэтому существуют специальные методы оценки как уравнения регрессии в целом, так и отдельных ее параметров.
Глава 2. Практическое применение регрессионного анализа в эконометрике
Задача 1По территории региона приводятся данные за 2007 (табл. 2.1).Номер региона | Среднедушевой прожиточный минимум в день одноготрудоспособного, руб., х | Среднедневная заработная плата, руб., у |
1 | 78 | 133 |
2 | 82 | 148 |
3 | 87 | 134 |
4 | 79 | 154 |
5 | 89 | 162 |
6 | 106 | 195 |
7 | 67 | 139 |
8 | 88 | 158 |
9 | 73 | 152 |
10 | 87 | 162 |
11 | 76 | 159 |
12 | 115 | 173 |
х | у | Ху | х2 | у2 | |
1 | 78 | 133 | 10374 | 6084 | 17689 |
2 | 82 | 148 | 12136 | 6724 | 21904 |
3 | 87 | 134 | 11658 | 7569 | 17956 |
4 | 79 | 154 | 12166 | 6241 | 23716 |
5 | 89 | 162 | 14418 | 7921 | 26244 |
6 | 106 | 195 | 20670 | 11236 | 38025 |
7 | 67 | 139 | 9313 | 4489 | 19321 |
8 | 88 | 158 | 13904 | 7744 | 24964 |
9 | 73 | 152 | 11096 | 5329 | 23104 |
10 | 87 | 162 | 14094 | 7569 | 26244 |
11 | 76 | 159 | 12084 | 5776 | 25281 |
12 | 115 | 173 | 19895 | 13225 | 29929 |
Итого | 1027 | 1869 | 161808 | 89907 | 294377 |
Среднее значение | 85,6 | 155,8 | 13484,0 | 7492,3 | 24531,4 |
σ | 12,95 | 16,53 | - | - | - |
σ2 | 167,7 | 273,4 | - | - | - |
Район | Расходы на покупку продовольственных товаров в общих расходах, %, у | Среднедневная заработная плата одного работающего, руб., х |
Удмуртская республика | 68,8 | 45,1 |
Свердловская область | 61,2 | 59,0 |
Башкортостан | 59,9 | 57,2 |
Челябинская область | 56,7 | 61,8 |
Пермская область | 55,0 | 58,8 |
Курганская область | 54,3 | 47,2 |
Оренбургская область | 49,3 | 55,2 |
У | х | у*х | х2 | у2 | |
1 | 68,8 | 45,1 | 3102,88 | 2034,01 | 4733,44 |
2 | 61,2 | 59,0 | 3610,80 | 3481,00 | 3745,44 |
3 | 59,9 | 57,2 | 3426,28 | 3271,84 | 3588,01 |
4 | 56,7 | 61,8 | 3504,06 | 3819,24 | 3214,89 |
5 | 55,0 | 58,8 | 3234,00 | 3457,44 | 3025,00 |
6 | 54,3 | 47,2 | 2562,96 | 2227,84 | 2948,49 |
7 | 49,3 | 55,2 | 2721,36 | 3047,04 | 2430,49 |
Итого | 405,2 | 384,3 | 22162,34 | 21338,41 | 23685,76 |
Среднее значение | 57,89 | 54,90 | 3166,05 | 3048,34 | 3383,68 |
σ | 5,74 | 5,89 | - | - | - |
σ2 | 32,92 | 34,34 | - | - | - |
х | у | Х | У | Х*У | Х2 | У2 | |
1 | 68,8 | 45,1 | 1,6542 | 1,8376 | 3,0398 | 2,7364 | 3,3768 |
2 | 61,2 | 59,0 | 1,7709 | 1,7868 | 3,1642 | 3,1361 | 3,1927 |
3 | 59,9 | 57,2 | 1,7574 | 1,7774 | 3,1236 | 3,0885 | 3,1592 |
4 | 56,7 | 61,8 | 1,7910 | 1,7536 | 3,1407 | 3,2077 | 3,0751 |
5 | 55,0 | 58,8 | 1,7694 | 1,7404 | 3,0795 | 3,1308 | 3,0290 |
6 | 54,3 | 47,2 | 1,6739 | 1,7348 | 2,9039 | 2,8019 | 3,0095 |
7 | 49,3 | 55,2 | 1,7419 | 1,6928 | 2,9487 | 3,0342 | 2,8656 |
Итого | 405,2 | 384,3 | 12,1587 | 12,3234 | 21,4003 | 21,1355 | 21,7078 |
Среднее значение | 57,89 | 54,90 | 1,7370 | 1,7605 | 3,0572 | 3,0194 | 3,1011 |
Σ | 5,74 | 5,89 | 0,0484 | 0,0425 | - | - | - |
σ2 | 32,92 | 34,34 | 0,0023 | 0,0018 | - | - | - |
В практических исследованиях возникает необходимость аппроксимировать (описать приблизительно) зависимость между переменными величинами у и х. Ее можно выразить аналитически с помощью формул и уравнений и графически в виде геометрического места точек в системе прямоугольных координат. Для выражения регрессии служат эмпирические и теоретические ряды, их графики — линии регрессии, а также корреляционные уравнения (уравнения регрессии) и коэффициент линейной регрессии.
Показатели регрессии выражают корреляционную связь двусторонне, учитывая изменение средней величины
признака у при изменении значений xi признака х, и, наоборот, показывают изменение средней величины признака х по измененным значениям yi признака у.Форма связи между показателями может быть разнообразной. И поэтому задача состоит в том, чтобы любую форму корреляционной связи выразить уравнением определенной функции (линейной, параболической и т.д.), что позволяет получать нужную информацию о корреляции между переменными величинами у и х, предвидеть возможные изменения признака у на основе известных изменений х, связанного с у корреляционно.