а0∑х + а1∑х2 = ∑ху.
Решим эту систему в общем виде:
; (16)
. (17)
Параметры уравнения парной линейной регрессии иногда удобно исчислять по следующим формулам, дающим тот же результат:
а1 =
, или а1 = ; (18)а0 =
[12] (19)Определив значения а0, а1и подставив их в уравнение связи
=а0 + а1х,находим значения
, зависящие только от заданного значения х.Для измерения степени тесноты связи между результативным фактором и признаком-фактором используется линейный коэффициент корреляции:
(20)
Линейный коэффициент корреляции может принимать любые значения в пределах от -1 до +1. Чем ближе коэффициент корреляции по своей абсолютной величине к 1, тем теснее связь между признаками. Знак при линейном коэффициенте корреляции указывает на направление связи- прямой зависимости соответствует знак плюс, а обратной – знак минус.
Для практического использования моделей регрессии очень важна их адекватность, т.е. соответствие фактическим статистическим данным.
Корреляционно-регрессионный анализ обычно проводится для ограниченной по объему совокупности. Поэтому показатели регрессии и корреляции - параметры уравнения регрессии, коэффициенты корреляции и детерминации могут быть искажены действием случайных факторов. Чтобы проверить насколько эти показатели характерны для всей генеральной совокупности, не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенных статистических моделей.
При численности объектов анализа до 30 единиц возникает необходимость проверки значимости (существенности) каждого коэффициента регрессии. При этом выясняют насколько вычисленные параметры характерны ля отображения комплекса условий: не являются ли полученные значения параметров результатами действия случайных причин.
Значимость коэффициентов простой линейной регрессии (применительно к совокупностям, у которых п˂30) осуществляют с помощью t – критерия Стьюдента. При этом вычисляют расчетные (фактические) значения t–критерия:
для параметра а0
; (21)для параметра а1
, (22)где п – объем выборки;
- среднее квадратическое отклонение результативного признака у от выровненных значений ;
- среднее квадратическое отклонение факторного признака х от общей средней .
Вычисленные по формулам значения, сравнивают с критическими t, которые определяют по таблице Стьюдента с учетом принятого уровня значимости α и числом степеней свободы вариации ν = n – k – 1. В социально-экономических исследованиях уровень значимости α обычно принимают равным 0,05. Параметр признается значимым (существенным) при условии, если tрасч˃ tтабл. В таком случае практически невероятно, что найденные значения параметров обусловлены только случайными совпадениями. Рассмотрим построение однофакторного уравнения регрессии зависимости прибыли у от затрат на оплату труда х по данным таблицы.
Расчетные значения для составления уравнения регрессии приведены в таблице 18.
Таблица 18 – Вспомогательная таблица для составления уравнения регрессии
Год | Затраты на оплату труда, тыс.руб, х | Прибыль, тыс.руб, у | х2 | у2 | ху |
|
| ( )2 | ( )∙ ( ) |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
1999 | 5500 | 10900 | 30250000 | 118810000 | 59950000 | -6204,6 | -11205,5 | 38497061,16 | 69525645,3 |
Продолжение таблицы 18
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
2000 | 5554 | 12322 | 30846916 | 151831684 | 30846916 | -6150,6 | -9783,5 | 37829880,36 | 60174395,1 |
2001 | 6675 | 15434 | 44555625 | 238208356 | 44555625 | -5029,6 | -6671,5 | 25296876,16 | 33554976,4 |
2002 | 8544 | 18736 | 72999936 | 351037696 | 72999936 | -3160,6 | -3369,5 | 9989392,36 | 10649641,7 |
2003 | 9736 | 19888 | 94789696 | 395532544 | 94789696 | -1968,6 | -2217,5 | 3875385,96 | 4365370,5 |
2004 | 10882 | 20100 | 118417924 | 404010000 | 118417924 | -822,6 | -2005,5 | 676670,76 | 1649724,3 |
2005 | 11925 | 21120 | 142205625 | 446054400 | 142205625 | 220,4 | -985,5 | 48576,16 | -217204,2 |
2006 | 14707 | 26158 | 216295849 | 684240964 | 216295849 | 3002,4 | 4052,5 | 9014405,76 | 12168441,75 |
2007 | 17677 | 31948 | 312476329 | 1020674704 | 312476329 | 5972,4 | 9842,5 | 35669561,76 | 58783347 |
2008 | 25846 | 44449 | 668015716 | 1975713601 | 668015716 | 14141,4 | 22343,5 | 199979194 | 315968370,9 |
Ито- го: | 117046 | 221055 | 1730853616 | 5786113949 | 1760553616 | 0 | 0 | 360877004,4 | 566622708,8 |
Пользуясь расчетными значениями, полученными в таблице 18, исчислим параметры для данного уравнения регрессии:
По формуле (18) рассчитаем коэффициент а1:
По формуле (19) рассчитаем коэффициент а0: а0 = 22105,5 - 1,57∙11704,6 = 3729,3
Составим уравнение регрессии:
= 3729,3 + 1,57х