где xme – нижняя граница медиального интервала;
h – величина интервала;
Σfi – сумма частот распределения;
Sme-1 – сумма частот домедиальных интервалов;
fme – частота медиального интервала
2) Для характеристики меры рассеяния признака определяют показатели вариации: размах вариации, дисперсию, среднее квадратическое отклонение, коэффициент вариации.
Размах вариации составит: R = xmax– xmin = 28,6 – 6,3 = 25,5 (ц/га)
Дисперсия определяется по формуле
Среднее квадратическое отклонение признака в ряду распределения составит:
(ц/га).Для определения коэффициента вариации используем формулу
3) Для характеристики формы распределения могут быть использованы коэффициенты асимметрии (Аs) и эксцесса (Еs):
Т.к.
>0, распределение имеет правостороннюю асимметрию, о которой также можно судить на основе следующего неравенства: < < Т.к. Es<0, распределение является низковершинным по сравнению с нормальным.Для того чтобы определить подчиняется ли эмпирическое (исходное) распределение закону нормального распределения, необходимо проверить статистическую гипотезу о существенности различия частот фактического и теоретического (нормального) распределения.
Наиболее часто для проверки таких гипотез используют критерий Пирсона (χ2), фактическое значение которого определяют по формуле
где fi и fm – частоты фактического и теоретического распределения.
Теоретические частоты для каждого интервала определим в следующей последовательности:
1) Для каждого интервала определим нормированное отклонение (t):
Например, для первого интервала
и т.д.Результаты расчета значений t представим в таблице 9.
2) Используя математическую таблицу “Значения функции
” , при фактической величине t для каждого интервала найдем значение функции нормального распределения (таблица 9).3) Определим теоретические частоты по формуле fm=
,где n – число единиц в совокупности;
h – величина интервала.
n = 21, h= 5,1, σ = 6,971
Таблица 9 – Эмпирическое и теоретическое распределение предприятий по
урожайности зерновых
Срединное значение интервала по урожайности,ц | Число хозяйств | ||||
fi | t | табличное | fm | - | |
7,45 | 6 | 1,11 | 0,2155 | 4 | 1,00 |
12,55 | 6 | 0,38 | 0,3712 | 6 | 0,00 |
14,65 | 4 | 0,35 | 0,3752 | 6 | 0,67 |
22,75 | 2 | 1,08 | 0,2227 | 4 | 1,00 |
27,85 | 3 | 1,81 | 0,0775 | 1 | 4,00 |
Итого | 21 | x | x | 21 | 6,67 |
4) Подсчитаем сумму теоретических частот и проверим ее равенство фактическому числу единиц, т.е.
.(21=21)Таким образом, фактическое значение критерия составило
=6,67.По математической таблице “Распределение χ2” определяем критическое значение критерия χ2 при числе степеней свободы (ν) равном числу интервалов минус единица и выбранном уровне значимости (в экономических исследованиях чаще всего используют уровень значимости равный 0,05). При ν = 5 – 1 = 4 и α=0,05
=9,95Поскольку фактическое значение критерия (
) меньше табличного ( ), отклонение фактического распределения от теоретического следует признать несущественным.Таким образом, средняя урожайность зерновых составила 15,2 ц с 1 га при среднем квадратичном отклонении 6,97 ц/га.
Так как коэффициент вариации больше 33%, совокупность единиц является неоднородной: V=45,9%.
Эмпирическое распределение имеет правостороннюю асимметрию, т.к.
< < и >0 и является низковершинным по сравнению с нормальным распределением, т.к. <0. При этом отклонение фактического распределения от нормального является несущественным. Следовательно, исходную совокупность единиц можно использовать для проведения экономико-статистического исследования при условии исключения из нее нетипичных предприятий.3.Экономико-статистический анализ взаимосвязей между признаками изучаемого явления.
3.1 Метод статистических группировок
Статистическая группировка – разбиение (разделение) множества единиц изучаемой совокупности на группы по определенным, существенным для них признакам и характеристика этих групп через систему показателей.
Метод статистической группировки применяют для решения следующих основных задач:
1) выделение социально-экономических типов явлений для последующего изучения;
2) изучение структуры явления и происходящих в нем структурных сдвигов;
3) выявление связей и зависимостей между признаками явлений.
Проведем аналитические группировки по различным признакам.
Аналитическая группировка применяется для изучения взаимосвязей между отдельными признаками изучаемого явления. При этом зависимые признаки называются результативными, а оказывающие на них влияние – факторными.
Используем две группировки: затраты на 1 га посева и урожайность зерновых; урожайность зерновых и себестоимость 1 ц зерна.
Первая группировка:
Таблица 10 – Исходные данные по предприятиям Зуевского и Куменского районов для первой группировки
№ предприятия | Затраты на 1 га посева, руб. | Урожайность зерновых, ц/га |
1 | 8330 | 28,6 |
2 | 7959 | 22,1 |
3 | 2244 | 6,3 |
4 | 4129 | 11,6 |
5 | 3425 | 15,1 |
6 | 4573 | 18,8 |
7 | 3451 | 12,4 |
8 | 1672 | 7,7 |
9 | 2811 | 13,7 |
10 | 5290 | 20,1 |
11 | 5762 | 20,8 |
12 | 2489 | 9,0 |
13 | 4602 | 13,2 |
14 | 2962 | 13,6 |
15 | 11108 | 30,4 |
16 | 2146 | 4,9 |
17 | 6365 | 27,5 |
18 | 3081 | 6,4 |
19 | 3181 | 9,3 |
20 | 3758 | 16,8 |
21 | 5217 | 18,7 |
1) В качестве факторного признака берем затраты на 1 га посева, в качестве результативного признака – урожайность зерновых. По результатам группировки можно будет сделать вывод о том как с изменением факторного признака (затраты на 1 га) изменяется в среднем результативный признак, т.е. урожайность зерновых.
2) Построим ранжированный ряд по группировочному признаку (т.е. располагаем их в порядке возрастания):
Таблица 11 – Ранжированный ряд предприятий по затратам на 1 га посева
№ предприятия | Затраты на 1 га посева, руб. | Урожайность зерновых, ц/га |
8 | 1672 | 7,7 |
16 | 2146 | 4,9 |
3 | 2244 | 6,3 |
12 | 2489 | 9,0 |
9 | 2811 | 13,7 |
14 | 2962 | 13,6 |
18 | 3081 | 6,4 |
19 | 3181 | 9,3 |
5 | 3425 | 15,1 |
7 | 3451 | 12,4 |
20 | 3758 | 16,8 |
4 | 4129 | 11,6 |
6 | 4573 | 18,8 |
13 | 4602 | 13,2 |
21 | 5217 | 18,7 |
10 | 5290 | 20,1 |
11 | 5762 | 20,8 |
17 | 6365 | 27,5 |
2 | 7959 | 22,1 |
1 | 8330 | 28,6 |
15 | 11108 | 30,4 |
Отбросим последнее значение (11108), т.к. оно резко отличается от остальных значений. Таким образом имеется 20 предприятий. Определим количество групп (k): при n<40 единиц оптимальное количество групп равно 3-4, значит n=20,k=3.