совокупности
2.1 Обоснование объема выборочной совокупности
Вариацию показателей, используемых при проведении экономико – статистического исследования, необходимо учитывать при определении необходимой численности выборки. В исследуемую совокупность полностью включены хозяйства 2-х районов Кировской области. Однако различие между ними, как следует из данных таблицы 8, остается существенным. Фактический размер предельной ошибки выборки определяется по формуле:
где t – нормированное отклонение, величина которого определяется заданным уровнем вероятности (при p=0,954 t=2);
V – коэффициент вариации признака.
Результаты расчета представлены в таблице 7.
Таблица 7 – Расчет фактической величины предельной ошибки и необходимой численности выборки
Показатель | Фактические значения | Необходимая численность выборки при | ||
V,% | ||||
Производительность труда, тыс.руб. | 219,125 | 68,7 | 28,05 | 104 |
Фондовооруженность, тыс.руб. | 276 | 48,8 | 19,9 | 52 |
Фондоотдача | 0,396 | 46 | 18,8 | 46 |
В таблице 7 необходимый объем численности выборки, при котором не будет превышена предельная ошибка в размере 13,5%, т. е.
где V – фактическое значение коэффициента вариации.
2.2 Оценка параметров и характера распределения
статистической совокупности
Выявление основных свойств и закономерностей исследуемой статистической совокупности необходимо начинать с построения ряда распределения единиц по одному из характеризующих признаков. Оценка параметров ряда распределения позволит сделать вывод о степени однородности статистической совокупности, о возможности использования ее единиц для проведения научно обоснованного экономического исследования.
Рассмотрим порядок построения ряда распределения 21 хозяйств области по среднесуточному приросту.
Так как данный признак изменяется непрерывно, строится вариационный ряд распределения.
1 Составляем ранжированный ряд распределения предприятий по среднесуточному приросту, т.е. располагаем их в порядке возрастания по данному признаку (г.): 147, 223, 294, 299, 308, 317, 342, 354, 358, 376, 379, 390, 402, 430, 444, 479, 513, 536, 548, 573, 582.
2 Определяем количество интервалов (групп) по формуле:
k = 1 + 3.322 lg N,
где N – число единиц совокупности.
При N = 24 lg = 1,3802 k
5.3
Определяем шаг интервала:где xmaxи xmin– наименьшее и наибольшее значение группировочного признака
k – количество интервалов.
4 Определяем границы интервалов.
Для этого xmin=147 принимаем за нижнюю границу первого интервала, а его верхняя граница равна: xmin+ h = 147 + 87 = 234. Верхняя граница первого интервала одновременно является нижней границей второго интервала. Прибавляя к ней величину h, определяем верхнюю границу второго интервала: 234 + 87 = 321. И т.д.: 321 + 87 = 408; 408 + 87 = 495; 495 + 87 = 582.
5 Подсчитаем число единиц в каждом интервале и запишем в виде таблицы.
Таблица 10 – Интервальный ряд распределения хозяйств по среднесуточному приросту
Группы хозяйств по среднесуточному приросту, г. | Число хозяйств |
147 - 234 | 2 |
234 - 321 | 4 |
321 - 408 | 7 |
408 - 495 | 3 |
495 - 582 | 5 |
Итого: | 21 |
Для выявления характерных черт, свойственных ряду распределения единиц, могут быть использованы следующие показатели.
1) Для характеристики центральной тенденции распределения определяют среднюю арифметическую, моду, медиану признака.
Средняя величина признака средней арифметической взвешенной:
где xi- варианты,- средняя величина признака;
fi – частоты распределения.
В интервальных рядах в качестве вариантов ( xi) используют средние значения интервалов.
Мода –наиболее часто встречающееся значение признака, может быть определена по формуле:
где хМо – нижняя граница модального интервала;
h – величина интервала;
∆1 - разность между частотой модального и домодального интервала;
∆2 - разность между частотой модального и послемодального интервала;Медиана –значение признака, находящегося в центре ранжированного ряда распределения, определяется по формуле:
где хМе - нижняя граница медиального интервала;
h – величина интервала;
∑fi – сумма частот распределения;
SMe-1 – сумма частот домедиальных интервалов;
fMe – частота медиального интервала.
2) Для характеристики меры рассеяния признака определяют показатели вариации: размах вариации, дисперсию, среднее квадратическое отклонение, коэффициент вариации.
Размах вариациисоставит: R=xmax-xmin=582-147=435(г).
Дисперсия определяется по формуле Среднее квадратическое отклонение признака в ряду распределения составит: Для определения коэффициента вариации используют формулуСреднесуточный прирост в среднем по хозяйствам составляет 385,3г. Среднесуточный прирост колеблется от 147 до 582г. и размах колебаний составляет 435г. В среднем среднесуточный прирост отклоняется на 110,4г. или на 28,7% от среднего значения. Коэффициент вариации так же показывает, что все хозяйства являются однородными по среднесуточному приросту, т.к. V<33%.
3)
Для характеристики формы распределения могут быть использованы коэффициенты асимметрии (As) и эксцесса (Еs): Так как As<0, распределение имеет левостороннюю асимметрию.Так как Еs<0, распределение является низковершинным по сравнению с нормальным.
Для того, чтобы определить, подчиняется ли эмпирическое (исходное) распределение закону нормального распределения, необходимо проверить статистическую гипотезу о существенности различия частот фактического и теоретического (нормального) распределения.
Наиболее часто для проверки таких гипотез используют критерий Пирсона (χ2), фактическое значение которого определяют по формулегде fi и fm – частоты фактического и теоретического распределения.
Теоретические частоты для каждого интервала определяют в следующей последовательности:
1.
Для каждого интервала определяют нормированное отклонение (t):Например, для первого интервала и т.д.
Результаты расчета значений t представлены в таблице 11.
2.
Используя математическую таблицу «Значения функции » , при фактической величине tдля каждого интервала, находят значение функции нормального распределения.