Регрессионный анализ
Задача
Некоторая фирма занимается поставками различных грузов на короткие расстояния внутри города. Необходимо оценить стоимость таких услуг, зависящую от затрачиваемого на поставку времени. В качестве наиболее важного фактора, влияющего на время доставки, выбрано пройденное расстояние. Были собраны исходные данные о десяти поставках (табл.).
Расстояние, км | 3,5 | 2,4 | 4,9 | 4,2 | 3,0 | 1,3 | 1,0 | 3,0 | 1,5 | 4,1 |
Время, мин | 16 | 13 | 19 | 18 | 12 | 11 | 8 | 14 | 9 | 16 |
Постройте график исходных данных, определите по нему характер зависимости между расстоянием и потраченным временем, постройте уравнение регрессии, проанализируйте силу регрессионной связи и сделайте прогноз поездки на 2 км.
Решение
Для расчёта стоимости услуг, зависящих от затрачиваемого на поставку времени, вычислим суммы (рис. 1):
t | y(t) |
расстояние. |
время |
1
3,50
16,00
12,25
56,00
256,00
15,22
2,63
2
2,40
13,00
5,76
31,20
169,00
12,30
1,70
3
4,90
19,00
24,01
93,10
361,00
18,95
28,58
4
4,20
18,00
17,64
75,60
324,00
17,08
12,14
5
3,00
12,00
9,00
36,00
144,00
13,89
0,09
6
1,30
11,00
1,69
14,30
121,00
9,37
17,88
7
1,00
8,00
1,00
8,00
64,00
8,57
25,27
8
3,00
14,00
9,00
42,00
196,00
13,89
0,09
9
1,50
9,00
2,25
13,50
81,00
9,90
13,67
10
4,10
16,00
16,81
65,60
256,00
16,82
10,36
сумма
28,9 |
136,0 |
99,4 |
435,3 |
1 972,0 |
136,0 |
112,4 |
13,60
a1 =
2,66
a0 =
5,91
r2 =
0,92
91,83%
8,17
Месяц | Объем собранного урожая | Факторы, влияющие на урожай | ||
Электроэнергия, кВт | Удобрения, тонн | Вода, литр | ||
t | y | x1 | x2 | x3 |
январь | 140 | 165 | 138 | 134 |
февраль | 138 | 164 | 139 | 128 |
март | 158 | 158 | 157 | 168 |
апрель | 144 | 159 | 142 | 147 |
май | 142 | 148 | 144 | 146 |
июнь | 134 | 152 | 136 | 140 |
июль | 122 | 143 | 122,5 | 132 |
август | 125 | 146 | 128 | 135 |
сентябрь | 124 | 148 | 119 | 125 |
октябрь | 138 | 150 | 142 | 126 |
ноябрь | 157 | 156 | 159 | 143 |
декабрь | 161 | 160 | 164 | 150 |
Необходимо определить степень влияния каждого отдельного фактора на результат (объем урожая). Для этого необходимо построить графики исходных данных, построить уравнения регрессии, проанализировать силу регрессионной связи (по коэффициенту детерминации) и сделать прогноз урожая по двум-трем значениям (в пределах прогноза исходных данных).
Решение
Строим графики исходных данных (рис. 2, 3):
Рис. 2 - График зависимости урожая от удобрения
Рис. 3 - График зависимости урожая от воды
Численные коэффициенты функции регрессии для первой зависимости:
Численные коэффициенты функции регрессии
X1i | Yi | X1iІ | X1i Yi | Yi І | Yi p | (Yi p -y)І | (Yi -y)І |
165 | 140 | 27225 | 23100 | 19600 | 152,5778 | 151,9747 | 0,0625 |
164 | 138 | 26896 | 22632 | 19044 | 151,4485 | 125,4073 | 5,0625 |
158 | 158 | 24964 | 24964 | 24964 | 144,673 | 19,56251 | 315,0625 |
159 | 144 | 25281 | 22896 | 20736 | 145,8022 | 30,82711 | 14,0625 |
148 | 142 | 21904 | 21016 | 20164 | 133,3803 | 47,19267 | 3,0625 |
152 | 134 | 23104 | 20368 | 17956 | 137,8974 | 5,534888 | 39,0625 |
143 | 122 | 20449 | 17446 | 14884 | 127,734 | 156,6506 | 333,0625 |
146 | 125 | 21316 | 18250 | 15625 | 131,1218 | 83,32442 | 232,5625 |
148 | 124 | 21904 | 18352 | 15376 | 133,3803 | 47,19267 | 264,0625 |
150 | 138 | 22500 | 20700 | 19044 | 135,6388 | 21,26283 | 5,0625 |
156 | 157 | 24336 | 24492 | 24649 | 142,4144 | 4,684729 | 280,5625 |
160 | 161 | 25600 | 25760 | 25921 | 146,9315 | 44,64219 | 430,5625 |
1849 | 1683 | 285479 | 259976 | 237963 | 738,2566 | 1922,25 | |
Среднее значение | 140,25 |
Коэффициент детерминации r2=0,384059.
Коэффициент детерминации низкий поэтому модель не адекватна.
Численные коэффициенты функции регрессии для первой зависимости, представляем расчеты виде таблицы:
Численные коэффициенты функции регрессии
X2i | Yi | X2iІ | X2i Yi | Yi І | Yi p | (Yi p -y)І | (Yi -y)І |
138 | 140 | 19044 | 19320 | 19600 | 137,5802 | 7,127725 | 0,0625 |
139 | 138 | 19321 | 19182 | 19044 | 138,5088 | 3,031641 | 5,0625 |
157 | 158 | 24649 | 24806 | 24964 | 155,224 | 224,2202 | 315,0625 |
142 | 144 | 20164 | 20448 | 20736 | 141,2947 | 1,091391 | 14,0625 |
144 | 142 | 20736 | 20448 | 20164 | 143,1519 | 8,421225 | 3,0625 |
136 | 134 | 18496 | 18224 | 17956 | 135,723 | 20,49389 | 39,0625 |
122,5 | 122 | 15006,25 | 14945 | 14884 | 123,1866 | 291,1588 | 333,0625 |
128 | 125 | 16384 | 16000 | 15625 | 128,294 | 142,9452 | 232,5625 |
119 | 124 | 14161 | 14756 | 15376 | 119,9365 | 412,64 | 264,0625 |
142 | 138 | 20164 | 19596 | 19044 | 141,2947 | 1,091391 | 5,0625 |
159 | 157 | 25281 | 24963 | 24649 | 157,0812 | 283,29 | 280,5625 |
164 | 161 | 26896 | 26404 | 25921 | 161,7243 | 461,1463 | 430,5625 |
1690,5 | 1683 | 240302,3 | 239092 | 237963 | 1856,658 | 1922,25 | |
Среднее значение | 140,25 |
Коэффициенты регрессии — сдвиг а0 и наклон а1 прямой у: