где yx- результативный признак, x -факторный признак; a0a1 – параметры;
a0 –начало отсчёта (значениеyxприx=0); a1 –коэффициент регрессии, показывающий, на сколько изменится yxвеличина при изменении x на единицу.
Для определения неизвестных параметров уравнения a0 и a1 решаем систему нормальных уравнений:
Σy =na0 + a1Σx (10)
Σxy =a0Σx + a1Σx2,
где n– число единиц в совокупности.
Таблица 3.1. | ||||||
Данные для проведения корреляционного анализа | ||||||
№ предприятия | Среднегодовой удой молока от коровы, ц | Расход кормов на корову, ц корм. ед. | Произведение вариант | Квадрат среднегодового удоя | Квадрат расхода кормов | Ожидаемый среднегодовой удой молока от коровы, ц |
y | x | xy | y2 | х2 | yx | |
1 | 36,4 | 40 | 1456 | 1324,96 | 1600 | 33,689 |
2 | 32,6 | 41 | 1336,6 | 1062,76 | 1681 | 34,504 |
3 | 33,1 | 41 | 1357,1 | 1095,61 | 1681 | 34,504 |
4 | 34 | 43 | 1462 | 1156 | 1849 | 36,133 |
5 | 38,1 | 43 | 1638,3 | 1451,61 | 1849 | 36,133 |
6 | 36,9 | 44 | 1623,6 | 1361,61 | 1936 | 36,947 |
7 | 39,3 | 45 | 1768,5 | 1544,49 | 2025 | 37,762 |
8 | 41,4 | 47 | 1945,8 | 1713,96 | 2209 | 39,391 |
9 | 38,2 | 48 | 1833,6 | 1459,24 | 2304 | 40,206 |
10 | 40,2 | 49 | 1969,8 | 1616,04 | 2401 | 41,020 |
11 | 39,6 | 50 | 1980 | 1568,16 | 2500 | 41,835 |
12 | 43,7 | 50 | 2185 | 1909,69 | 2500 | 41,835 |
13 | 39,9 | 51 | 2034,9 | 1592,01 | 2601 | 42,649 |
14 | 41,1 | 51 | 2096,1 | 1689,21 | 2601 | 42,649 |
15 | 49,3 | 53 | 2612,9 | 2430,49 | 2809 | 44,278 |
16 | 49,1 | 54 | 2651,4 | 2410,81 | 2916 | 45,093 |
17 | 43,6 | 54 | 2354,4 | 1900,96 | 2916 | 45,093 |
18 | 44,2 | 55 | 2431 | 1953,64 | 3025 | 45,907 |
19 | 49,8 | 57 | 2838,6 | 2480,04 | 3249 | 47,536 |
20 | 44,2 | 57 | 2519,4 | 1953,64 | 3249 | 47,536 |
Итого | Σy = | Σx = | Σxy = | Σy2 = | Σx2 = | |
814,7 | 973 | 40095,00 | 33674,93 | 47901,00 | х |
Определяем значения Σy, Σx, Σxy, иΣx2по данным наблюдения таблицы 3.1. и подставляем их в уравнения:
814,7 = 20a0 + 973a1
40095=973a0 + 47901a1
Затем делим каждый член уравнения на коэффициент при a0:
40,735 = a0 + 48,65a1
41,208=a0 + 49,23a1
Вычитая одно уравнение из другого, получаем:
0,473 = 0,58a1
После решения уравнений получаем значение параметров:
a0 =1,108; a1 =0,815.
Уравнение регрессии имеет вид:
yx = 1,108 + 0,815x.
Полученные данные можно проверить с помощью функции MicrosoftExcel- ЛИНЕЙН. (Таблицы3.2, 3.3.)
Таблица 3.2. | Таблица 3.3. | ||
Результаты решенияй, найденных с помощью функции ЛИНЕЙН | Название показателей, выводимых с помощью функции ЛИНЕЙН | ||
0,8145337 | 1,1079355 | значение коэффициента а1 | значение коэффициента а0 |
0,1057151 | 5,1736194 | среднеквадратичное отклонение а1 | среднеквадратичное отклонение а0 |
0,7673421 | 2,5118193 | Коэфициент детерминации r2 | среднеквадратичное отклонение y |
59,366814 | 18 | F - критерий | Число степеней свободы вариации |
374,55925 | 113,56625 | Регрессивная сумма квадратов | Остаточная сумма квадратов |
Для оценки тесноты связи рассчитаем коэффициент корреляции:
(11)20 ∙40095 — 814.7 ∙973
r= ———————————————————— = 0,876
(20 ∙47901 — 9732)∙(20 ∙33674,93 — 814.72)
Чем ближе коэффициент корреляции к единице, тем связь сильнее. это объясняется тем, что чем ближе коэффициент детерминации к единице, тем большая доля вариации результативного признака обусловлена влиянием факторного признака, а значит, и теснее статистическая зависимость между ними.
Значение rблизко к единице, поэтому можно утверждать, что полученное уравнение регрессии достаточно хорошо описывает исследуемую зависимость.
Коэффициент детерминации r2 = 0.7674 показывает, что 76,7% колеблемости в среднегодовом удое молока от коровы объясняется уровнем кормления.
Для оценки достоверности коэффициента корреляции применяют t- критерий Стьюдента. Для этого сначала определим его фактическое значение по формуле:
(12)0,87620—2
tфакт = —————— = 7,7049
1—0,8762
Полученные значения r иtфакт можно проверить с помощью надстройки MicrosoftExcel– Анализ данных. (Таблицы3.4.)
Таблица 3.4. | ||||||||||||||||
Результаты решения с помощью надстройки Анализ данных | ||||||||||||||||
ВЫВОД ИТОГОВ | ||||||||||||||||
Регрессионная наименование в Microsoft Excel | принятые наименования | |||||||||||||||
Множественный R | 0,875981 | Коэфициент (индекс) множественной кореляции | ||||||||||||||
R-квадрат | 0,767342 | коэфициент (индекс) детерминации | ||||||||||||||
Наблюдения | 20 |
Коэффициенты | Стандартная ошибка | t-статисти ка | P-Значение | |
Y-пересечение | 10,2751 | 5,0170 | 2,0480 | 0,0554 |
x | 0,9421 | 0,1223 | 7,7050 | 4,16741E-07 |
Далее полученное значение tфактсравниваем с t-критерия табличным (Приложение 1).
ПРИЛОЖЕНИЕ 1 | |||||||
Значение t-критерия Стьюдента | |||||||
Число степе- | Уровень значимости | Число степе- | Уровень значимости | ||||
ней свободы | 0,10 | 0,05 | 0,01 | ней свободы | 0,10 | 0,05 | 0,01 |
1 | 6,3138 | 12,706 | 63,657 | 18 | 1,7341 | 2,1009 | 2,8784 |
2 | 2,9200 | 4,3027 | 9,9248 | 19 | 1,7291 | 2,0860 | 2,8609 |
3 | 2,3534 | 3,1825 | 5,8409 | 20 | 1,7247 | 2,0860 | 2,8453 |
4 | 2,1318 | 2,7764 | 4,6041 | 21 | 1,7207 | 2,0796 | 2,8314 |
5 | 2,0150 | 2,5706 | 4,0321 | 22 | 1,7171 | 2,0739 | 2,8188 |
6 | 1,9432 | 2,4469 | 3,7074 | 23 | 1,7139 | 2,0687 | 2,8073 |
7 | 1,8946 | 2,3646 | 3,4995 | 24 | 1,7109 | 2,0639 | 2,7969 |
8 | 1,8595 | 2,3060 | 3,3564 | 25 | 1,7081 | 2,0595 | 2,7874 |
9 | 1,8331 | 2,2622 | 3,2498 | 26 | 1,7056 | 2,0555 | 2,7787 |
10 | 1,8125 | 2,2281 | 3,1693 | 27 | 1,7033 | 2,0518 | 2,7707 |
11 | 1,7959 | 2.2010 | 3,1058 | 28 | 1,7011 | 2,0484 | 2,7633 |
12 | 1,7823 | 2,1788 | 3,0545 | 29 | 1,6991 | 2,0452 | 2,7564 |
13 | 1,7709 | 2,1604 | 3,0123 | 30 | 1,6973 | 2,0423 | 2,7500 |
14 | 1,7613 | 2,1448 | 2,9768 | 40 | 1,6839 | 2,0211 | 2,7045 |
15 | 1,7530 | 2,1315 | 2,9467 | 60 | 1,6707 | 2,003 | 2,6603 |
16 | 1,7459 | 2,1199 | 2,9208 | 120 | 1,6577 | 1,9799 | 2,6174 |
17 | 1,7396 | 2,1098 | 2,8982 | ∞ | 1,6449 | 1,9600 | 2,5758 |
Табличное значение t-критерия при уровне значимости 0,05 и при v = n – k = 20 –2 =18 степенях свободы вариации составляет 2,1009.
Так как фактическое значение t-критерия больше табличного, следовательно, связь между признаками достоверна и уравнение регрессии в полной мере отражает эту связь.
3.3. Выводы.
Величина a0 =1,108 в уравнении регрессии yx = 1,108 + 0,815x не имеет смысла. Коэффициент регрессии a1 =0,815 характеризует изменение продуктивности коров по данной совокупности в зависимости от уровня кормления. При увеличении или уменьшении расхода кормов на 1 ц. к ед. прослеживается связь на увеличение или уменьшение среднегодового удоя молока от коровы соответственно на 0,815 ц.
Полученное уравнение регрессии, кроме оценки влияния уровня кормления на продуктивность коров, позволяет прогнозировать её в зависимости от величины данного фактора. При этом, уровень кормления должен находиться в пределах его изменения в исходной выборочной совокупности.
Ожидаемый удой молока в зависимости от расхода кормов по 20 сельскохозяйственных предприятиях представлен в последней графе таблицы 3.1 (параметр yx).
РАЗДЕЛ 4. РЯДЫ ДИНАМИКИ.