Коэффициент корреляции r значим на уровне a (Н0: r = 0), если
. (27)Одной из наиболее эффективных оценок адекватности регрессионной модели, мерой качества уравнения регрессии, характеристикой прогностической силы анализируемой регрессионной модели является коэффициент детерминации, определяемый по формуле:
. (28)Величина R2 показывает, какая часть (доля) вариации зависимой переменной обусловлена вариацией объясняющей переменной.
В случае парной линейной регрессионной модели коэффициент детерминации равен квадрату корреляции, т.е. R2 = r2.
Доверительный интервал для индивидуальных значений зависимой переменной
. -t1 – a; n- 2× £ £ + t1 -a; n- 2× , (29)где
- оценка дисперсии индивидуальных значений у0 при х = х0.Доверительный интервал для параметров регрессионной модели.
(30)1.4. Типичный пример анализа экономических процессов
с использованием пространственных данных
По 28 предприятиям концерна изучается зависимость дневной выработки (ед.) у от уровня механизации труда (%) х по следующим данным (табл. 2).
Таблица 2
Номер пред-приятия | Уровень механизации, %, х | Дневная выработка, ед., у | Номер пред-приятия | Уровень механизации, %, х | Дневная выработка, ед., у |
1 | 15 | 5 | 15 | 63 | 24 |
2 | 24 | 6 | 16 | 64 | 25 |
3 | 42 | 6 | 17 | 66 | 25 |
4 | 46 | 9 | 18 | 70 | 27 |
5 | 48 | 15 | 19 | 72 | 31 |
6 | 48 | 14 | 20 | 75 | 33 |
7 | 50 | 17 | 21 | 76 | 33 |
8 | 52 | 17 | 22 | 80 | 42 |
9 | 53 | 22 | 23 | 82 | 41 |
10 | 54 | 21 | 24 | 87 | 44 |
11 | 55 | 22 | 25 | 90 | 53 |
12 | 60 | 23 | 26 | 93 | 55 |
13 | 61 | 23 | 27 | 95 | 57 |
14 | 62 | 24 | 28 | 99 | 62 |
При анализе статистических зависимостей широко используются графические методы, которые задают направление его дальнейшего анализа. В Excel для этого можно использовать средство Мастер диаграмм. Для создания диаграммы необходимо выделить данные, запустить мастер диаграмм, выбрать тип и вид диаграммы (для нашего примера тип диаграммы – Точечная), выбрать и уточнить ориентацию диапазона данных и ряда, настроить параметры диаграммы.
Для описания закономерностей в исследуемой выборке наблюдений строится линия тренда.
Для добавления линии тренда в диаграмму необходимо выполнить следующие действия:
1) щелкнуть правой кнопкой мыши по ряду данных;
2) в динамическом меню выбрать команду Добавить линию тренда. На экране появится окно Линия тренда (рис. 2);
3) выбрать вид зависимости регрессии. Для нашего примера тип тренда определим, как Линейный;
4) перейти на вкладку Параметры. В поле Показать уравнение на диаграмме установить подтверждение;
5) в случае необходимости можно задать остальные параметры.
Рис. 2. Диалоговое окно для выбора типа тренда
Изобразим полученную зависимость графически точками координатной плоскости (рис. 3). Такое изображение статистической зависимости называется полем корреляции.
По расположению эмпирических точек можно предполагать наличие линейной корреляционной (регрессионной) зависимости между переменными х и у.
По данным табл. 2 найдем уравнение регрессии у по х. Расчеты произведем в Excel по формулам (7)–(13), промежуточные вычисления представим в табл. 3.
Рис. 3. Поле корреляции
Таблица 3
N | X | Y | X*Y | X*X | Y*Y |
1 | 15 | 5 | 75 | 225 | 25 |
2 | 24 | 6 | 144 | 576 | 36 |
3 | 42 | 6 | 252 | 1764 | 36 |
4 | 46 | 9 | 414 | 2116 | 81 |
5 | 48 | 15 | 720 | 2304 | 225 |
6 | 48 | 14 | 672 | 2304 | 196 |
7 | 50 | 17 | 850 | 2500 | 289 |
8 | 52 | 17 | 884 | 2704 | 289 |
9 | 53 | 22 | 1166 | 2809 | 484 |
10 | 54 | 21 | 1134 | 2916 | 441 |
11 | 55 | 22 | 1210 | 3025 | 484 |
12 | 60 | 23 | 1380 | 3600 | 529 |
13 | 61 | 23 | 1403 | 3721 | 529 |
14 | 62 | 24 | 1488 | 3844 | 576 |
15 | 63 | 24 | 1512 | 3969 | 576 |
16 | 64 | 25 | 1600 | 4096 | 625 |
17 | 66 | 25 | 1650 | 4356 | 625 |
18 | 70 | 27 | 1890 | 4900 | 729 |
19 | 72 | 31 | 2232 | 5184 | 961 |
20 | 75 | 33 | 2475 | 5625 | 1089 |
21 | 76 | 33 | 2508 | 5776 | 1089 |
22 | 80 | 42 | 3360 | 6400 | 1764 |
23 | 82 | 41 | 3362 | 6724 | 1681 |
24 | 87 | 44 | 3828 | 7569 | 1936 |
25 | 90 | 53 | 4770 | 8100 | 2809 |
26 | 93 | 55 | 5115 | 8649 | 3025 |
27 | 95 | 57 | 5415 | 9025 | 3249 |
28 | 99 | 62 | 6138 | 9801 | 3844 |
Сумма | 1782 | 776 | 57647 | 124582 | 28222 |
Среднее | 63,64286 | 27,71429 | 2058,821 | 4449,357 | |
Дисперсия | 398,9439 | 239,8469 | b1 | 0,739465 | |
Cov(x,y) | 295,0051 | b0 | -19,3474 |
Итак, уравнение регрессии у по х:
= -19,37 + 0,74x.Из полученного уравнения регрессии следует, что при увеличении уровня механизации х на 1% выработка у увеличивается в среднем на 0,74 ед.
По исходным данным вычислим коэффициент корреляции.
Расчеты произведем в Excel, промежуточные вычисления см. табл. 3 и формулы (15), (16).
= 0,954,т.е. связь между переменными тесная.
Оценим на уровне значимости a = 0,05 значимость уравнения регрессии у по х.
1-й способ. Используя данные табл. 4 вычислим необходимые суммы по формулам табл. 1:
= 6715,71 (см. столбец 6);QR =
= 6108,09 (см. столбец 7);Qe = Q-QR = 6715,71 – 6108,09 = 607,63
Таблица 4
N | X | Y | Yрег | Yi-Yрег | (Yi-Yср)^2 | (Yрег-Yср)^2 | (Xi-Xcp)^2 |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
1 | 15 | 5 | -8,25541 | 13,2554 | 515,9388 | 1293,8192 | 2366,12755 |
2 | 24 | 6 | -1,60023 | 7,6002 | 471,5102 | 859,3406 | 1571,55612 |
3 | 42 | 6 | 11,71015 | -5,7101 | 471,5102 | 256,1325 | 468,413265 |
4 | 46 | 9 | 14,66801 | -5,6680 | 350,2245 | 170,2054 | 311,270408 |
5 | 48 | 15 | 16,14694 | -1,1469 | 161,6531 | 133,8035 | 244,69898 |
6 | 48 | 14 | 16,14694 | -2,1469 | 188,0816 | 133,8035 | 244,69898 |
7 | 50 | 17 | 17,62587 | -0,6259 | 114,7959 | 101,7762 | 186,127551 |
8 | 52 | 17 | 19,1048 | -2,1048 | 114,7959 | 74,1233 | 135,556122 |
9 | 53 | 22 | 19,84426 | 2,1557 | 32,6531 | 61,9372 | 113,270408 |
10 | 54 | 21 | 20,58373 | 0,4163 | 45,0816 | 50,8448 | 92,9846939 |
11 | 55 | 22 | 21,32319 | 0,6768 | 32,6531 | 40,8461 | 74,6989796 |
12 | 60 | 23 | 25,02052 | -2,0205 | 22,2245 | 7,2564 | 13,2704082 |
13 | 61 | 23 | 25,75998 | -2,7600 | 22,2245 | 3,8193 | 6,98469388 |
14 | 62 | 24 | 26,49945 | -2,4995 | 13,7959 | 1,4758 | 2,69897959 |
15 | 63 | 24 | 27,23892 | -3,2389 | 13,7959 | 0,2260 | 0,41326531 |
16 | 64 | 25 | 27,97838 | -2,9784 | 7,3673 | 0,0697 | 0,12755102 |
17 | 66 | 25 | 29,45731 | -4,4573 | 7,3673 | 3,0381 | 5,55612245 |
18 | 70 | 27 | 32,41517 | -5,4152 | 0,5102 | 22,0983 | 40,4132653 |
19 | 72 | 31 | 33,8941 | -2,8941 | 10,7959 | 38,1901 | 69,8418367 |
20 | 75 | 33 | 36,1125 | -3,1125 | 27,9388 | 70,5300 | 128,984694 |
21 | 76 | 33 | 36,85196 | -3,8520 | 27,9388 | 83,4971 | 152,69898 |
22 | 80 | 42 | 39,80982 | 2,1902 | 204,0816 | 146,3020 | 267,556122 |
23 | 82 | 41 | 41,28875 | -0,2888 | 176,5102 | 184,2662 | 336,984694 |
24 | 87 | 44 | 44,98608 | -0,9861 | 265,2245 | 298,3149 | 545,556122 |
25 | 90 | 53 | 47,20447 | 5,7955 | 639,3673 | 379,8675 | 694,69898 |
26 | 93 | 55 | 49,42287 | 5,5771 | 744,5102 | 471,2626 | 861,841837 |
27 | 95 | 57 | 50,9018 | 6,0982 | 857,6531 | 537,6608 | 983,270408 |
28 | 99 | 62 | 53,85966 | 8,1403 | 1175,5102 | 683,5807 | 1250,12755 |
Сумма | 1782 | 776 | 0,00 | 6715,7143 | 6108,0879 | 11170,4286 | |
Среднее | 63,64286 | 27,71429 | |||||
b1 | 0,739465 | ||||||
b0 | -19,3474 |
F =
= 261,36.