Для характеристики степени колебаемости признака недостаточно знать среднее квадратическое отклонение в абсолютных величинах. Необходимо выразить его в процентах к средней арифметической, т.е. вычислить коэффициент вариации, по формуле:
V=s/xср*100=14,8/40,90*100=36,36% (4)
Коэффициент вариации свидетельствует о том, что колебаемость уровней дохода достаточно значительна.
Сделанная 1%-ная механическая выборка показывает, что среднее арифметическое значение денежного дохода в выборке равна для интервального ряда 40,90, для всей выборки в целом среднее арифметическое значение денежного дохода равна 36,36. Столь значительное отклонение объясняется тем, что середины интервалов не равны средним значениям в группе. Коэффициент вариации этого показателя составляет 36,36%, среднее квадратическое отклонение равно 14,8.
Связь между признаками – денежный доход и расходы. Определим наличие связи между денежным доходом и расходами методом аналитической группировки. Для этого рассчитаем среднее значение доходов и расходов в каждой группе.
Таблица П4.5 -Среднее значение доходов и расходов
№ группы | Интервал | № п/п | В среднем | Количество в группе | Среднее значение доходов в группе | Среднее значение расходов в группе | |
Денежный доход | Расходы | ||||||
1 | 17,1-29,1 | 3 | 17,1 | 10,2 | 6 | 23,783 | 12,883 |
30 | 20,5 | 11,6 | |||||
4 | 24 | 12,4 | |||||
21 | 24,3 | 13,4 | |||||
25 | 28 | 14,8 | |||||
1 | 28,8 | 14,9 | |||||
2 | 29,1-41,1 | 5 | 31,2 | 16,1 | 13 | 36,438 | 18,023 |
6 | 32,2 | 16,6 | |||||
13 | 33 | 17,1 | |||||
8 | 33,3 | 17,4 | |||||
19 | 34,4 | 17,7 | |||||
26 | 36,7 | 18 | |||||
7 | 37,3 | 18,4 | |||||
29 | 37,8 | 18,4 | |||||
15 | 38 | 18,6 | |||||
24 | 38,8 | 18,6 | |||||
20 | 39,8 | 19,3 | |||||
28 | 40,4 | 17,8 | |||||
23 | 40,8 | 20,3 | |||||
3 | 41,1-53,1 | 16 | 44,3 | 20,5 | 5 | 46,820 | 20,380 |
18 | 44,7 | 19,9 | |||||
22 | 47,5 | 20 | |||||
14 | 48,2 | 20,5 | |||||
27 | 49,4 | 21 | |||||
4 | 53,1-65,1 | 2 | 55,8 | 22,2 | 3 | 57,667 | 22,800 |
17 | 58,1 | 23,2 | |||||
12 | 59,1 | 23 | |||||
Продолжение таблицы П4.5 | |||||||
5 | 65,1-77,1 | 10 | 66 | 24,3 | 3 | 70,700 | 23,900 |
11 | 69 | 22,2 | |||||
9 | 77,1 | 25,2 | |||||
Сумма | 1198,9 | 553,6 | 30 | 235,408 | 97,986 | ||
Среднее значение | 39,967 | 18,453 | 47,082 | 19,597 |
Сопоставляя возрастающие средние значения денежного дохода и расходов по группам видим, что между фактором и результативным признаком имеется прямая связь.
Линейный коэффициент корреляции найдём по формуле:
Вычисления сведём в таблицу П4.6
№ а п/п | Денежный доход, X | Расходы Y | XY | X^2 | Y^2 |
1 | 28,8 | 14,9 | 429,12 | 829,44 | 222,01 |
2 | 55,8 | 22,2 | 1238,76 | 3113,64 | 492,84 |
3 | 17,1 | 10,2 | 174,42 | 292,41 | 104,04 |
4 | 24 | 12,4 | 297,6 | 576 | 153,76 |
5 | 31,2 | 16,1 | 502,32 | 973,44 | 259,21 |
6 | 32,2 | 16,6 | 534,52 | 1036,84 | 275,56 |
7 | 37,3 | 18,4 | 686,32 | 1391,29 | 338,56 |
8 | 33,3 | 17,4 | 579,42 | 1108,89 | 302,76 |
9 | 77,1 | 25,2 | 1942,92 | 5944,41 | 635,04 |
10 | 66 | 24,3 | 1603,8 | 4356 | 590,49 |
11 | 69 | 22,2 | 1531,8 | 4761 | 492,84 |
12 | 59,1 | 23 | 1359,3 | 3492,81 | 529 |
13 | 33 | 17,1 | 564,3 | 1089 | 292,41 |
14 | 48,2 | 20,5 | 988,1 | 2323,24 | 420,25 |
15 | 38 | 18,6 | 706,8 | 1444 | 345,96 |
16 | 44,3 | 20,5 | 908,15 | 1962,49 | 420,25 |
17 | 58,1 | 23,2 | 1347,92 | 3375,61 | 538,24 |
18 | 44,7 | 19,9 | 889,53 | 1998,09 | 396,01 |
19 | 34,4 | 17,7 | 608,88 | 1183,36 | 313,29 |
20 | 39,8 | 19,3 | 768,14 | 1584,04 | 372,49 |
21 | 24,3 | 13,4 | 325,62 | 590,49 | 179,56 |
22 | 47,5 | 20 | 950 | 2256,25 | 400 |
23 | 40,8 | 20,3 | 828,24 | 1664,64 | 412,09 |
24 | 38,8 | 18,6 | 721,68 | 1505,44 | 345,96 |
25 | 28 | 14,8 | 414,4 | 784 | 219,04 |
26 | 36,7 | 18 | 660,6 | 1346,89 | 324 |
27 | 49,4 | 21 | 1037,4 | 2440,36 | 441 |
28 | 40,4 | 17,8 | 719,12 | 1632,16 | 316,84 |
29 | 37,8 | 18,4 | 695,52 | 1428,84 | 338,56 |
30 | 20,5 | 11,6 | 237,8 | 420,25 | 134,56 |
Сумма | 1235,6 | 553,6 | 24252,5 | 56905,32 | 10606,62 |
Ср.зн. | 41,19 | 18,45 | 808,42 | 1896,84 | 353,55 |
r= | 0,946689 |
Величина 0,947 показывает на очень сильную прямую связь между фактором и результативным признаками, т.е. расходы во многом зависят от доходов.
Ошибку выборки среднего денежного дохода и границы, в которых он будет находиться в генеральной совокупности рассчитаем по формуле:
= 72,25 (6)По условию Ф(t)=0,954, тогда по таблице Лапласа находим t= 1,96. Среднеквадратическая ошибка выборки будет равна
, тогда ошибка выборки D=1,96*1,232 =2,474. Следовательно, границы, в которых будет находиться средний уровень денежного дохода в генеральной совокупности будут равны: 40,90-2,474 и 40,90+2,474, т.е. нижняя граница - 38,43, верхняя граница - 43,37.Как изменится объём выборки при той же вероятности, если ошибка среднего денежного дохода составит 3 тыс. руб. можно вычислить по формуле n=t2S2N/(D2N+t2S2), где N=30/0,01=3000 (7)
n=1,962*221*3000/(32*3000+1,962*221)=91
Таким образом, чтобы обеспечить ошибку среднего денежного дохода в генеральной совокупности равную 3 тыс. руб. необходимо сделать выборку объёмом 91.
Для того чтобы определить оценку существенности коэффициента корреляции необходимо найти расчетное значение t-критерия Стьюдента:
(8)По таблице критических точек распределения Стьюдента (приложение 1) найдем tкр при уровне значимости α=0,01 и числе степеней свободы
Так как (12,52>2.76). Поэтому линейный коэффициент считается значимым, а связь между х и у – существенной.Чтобы построить уравнение регрессии , необходимо найти:
идентификацию параметров регрессии.
(9)где, y– фактические (эмпирические) уровни ряда;
t– время (порядковый номер периода или момента времени).
Вычислим параметры по формулам:
; (10) (11)Уравнение регрессии
ŷ = 18,45+0,015·х. R2= 0,90
стандартная ошибка 271,4 0,05
t-критерия 16,01 -6,05
Проверка значимости параметров регрессии.
, . , . Так как (16,01>2.76), то параметр является значимым. .Так как (6,05>2,76), то параметр является значимым.Проверка значимости уравнения регрессии в целом.
, , . 252. По таблице критических значений критерия Фишера ( приложение 2) найдем . Так как (252>4,20) то для уровня значимости и числе степеней свободы , построенное уравнение регрессии можно считать значимым.