Смекни!
smekni.com

Сущность и методы статистического наблюдения (стр. 6 из 7)

где

- максимальное значение признака,
- минимальное значение признака,
- число выделяемых групп.

При решении вопроса о том, сколько следует образовать групп, нужно принимать во внимание размах варьирования и численность единиц изучаемой совокупности. Чем больше размах варьирования признака, положенного в основу группировки, тем, как правило, больше может быть образовано групп.

Зависимость между числом групп

и численностью единиц совокупности nможно выразить формулой американского ученого Стерджесса:

Эта зависимость может служить ориентировкой при определении числа групп в том случае, когда распределение единиц совокупности по данному признаку приближается к нормальному.

15-24 25-44 45-89 90-179 180-359 360-719 720-1439
5 6 7 8 9 10 11

Если, например, требуется произвести группировку с равными интервалами по данным о стоимости основных фондов предприятий, максимальное значение которой составляет 7 млн. руб., минимальная – 1 млн. руб. и необходимо выделить при этом 4 группы, то величина интервала определяется следующим образом

млн. руб.

В нашем примере группировка с равными интервалами примет такой вид

1 – 2,5

2,5 – 4

4 – 5,5

5,5 – 7

При такой записи следует помнить правило, что левая цифра включает в себя обозначенное значение, а правая не включает. Следовательно, предприятия с основными фондами 2,5 млн. руб. должно быть отнесено ко второй группе.

Проиллюстрируем построение ряда распределения на условном примере.

Пример 2.1. Имеются следующие данные о производственном стаже работников малого предприятия, лет.

9, 3, 7, 2, 5, 3, 11, 6, 5, 4, 7

Необходимо построить ряд распределения работников по стажу, обработав 3 группы с равными интервалами.

Решение.

Величина интервала группировки работников по стажу определяется по формуле

года

Тогда интервалы будут следующими:

2 – 5, 5 – 8, 8 – 11

Подсчитаем частоты и представим результаты в таблице, которую дополним частостями и кумулятивными частотами

Таблица 2.1. Ряд распределения работников по производственному стажу

Группы работников по стажу Число работников, чел.
Число работников, % к итогу
Накопленная частота
Середина интервала
2 – 55- 88 - 11 452 36,445,418,2 4911 3,56,58,5
Итого 11 100,0 -

Ряды распределения для наглядности и удобства анализа могут быть изображены графически. Основные виды графиков рядов распределения: полигон частот (Рис. 1), гистограмма (Рис. 2), кумулята (Рис. 3).

Для изображения построенного интервального ряда работников по производственному стажу в виде полигона частот следует превратить его в дискретный ряд. Для этого определить середины (центры) интервалов -

(3, 5; 6,5; 9,5). Из этих середин восстановить перпендикуляры равные частотам и соединить их вершины отрезками.

При построении гистограммы ряда распределения работников по стажу работы на оси абсцисс откладывают интервалы ряда, высота которых равна частотам отложенным по оси ординат. Над осью абсцисс строятся прямоугольники, площадь которых соответствует величинам произведений интервалов на их частоты.

Рис. 2. Гистограмма ряда распределения работников по стажу работы

При графическом изображении кумуляты накопленные частоты наносят на поле графика в виде перпендикуляров к оси абсцисс в верхних границах интервалов, а именно 5, 8, 11. Перпендикуляры затем соединяют отрезками, в результате чего получают ломаную линию, которая начинается от нуля все время возрастает, до тех пор, пока не достигнет высоты, равной общей сумме частот.

Рис. 3. Кумулята ряда распределения работников по стажу работы

Анализ ряда и графиков показывает, что распределение работников по стажу не является равномерным, чем больше стаж работников отличается от среднего стажа, тем реже такие работники встречаются.

Обобщение первичных данных в виде ряда распределения позволяет видеть вариацию и состав совокупности по изучаемому признаку, сравнивать между собой группы, изучать их динамику и устанавливать характер распределения единиц по тому или иному признаку.

Однако ряды распределения не дают всесторонней характеристики выделенных групп. Чтобы решить ряд конкретных задач, выявить особенности в развитии явлений, обнаружить тенденции, установить зависимости, необходимо произвести группировку статистических данных.

Как осуществляется конкретная группировка рассмотрим в следующем вопросе.

5. Осуществление конкретной аналитической группировки

Изучив задачи, особенности и технику построения рядов распределения, перейдем к применению метода группировки.

Пример 2.2 Имеются следующие условные данные о производственном стаже работников (из примера 1) и их среднесменной выработке изделий.

Таблица 2.2

№ работника по списку Производственный стаж, лет Среднесменная выработка изделий, шт
1234567891011 937253116547 1077698129879

С целью выявления наличия, направления и характера взаимосвязи между выработкой и стажем работников необходимо:

1. провести аналитическую группировку, образовав три группы работников с равными интервалами

2. построить корреляционную таблицу, образовав три группы по обоим признакам

Решение

1. Поскольку аналитическая группировка предполагает разделение единиц совокупности на группы по факторному признаку, необходимо его определить.

В нашем примере факторным признаком является производственный стаж, так как от него зависит выработка. Определим величину интервала группировки по стажу работы.

г.

Тогда интервалы будут: 2-5; 5-8; 8-11.

Чтобы дополнить эти данные средними по группам значениями выработки изделий необходимо построить рабочую таблицу 3.

Таблица 2.3 Распределение работников по стажу

Группы работников по производственному стажу, г. Номера и число работников, чел. Стаж работы, г. Выработка изделий, шт.
1 2 3 4
2-5 24610 3234 7687
Всего 4 12 28
5-8 358911 75657 79989
Всего 5 30 42
8-11 17 911 1012
Всего 2 20 22
Итого 11 62 92

На основании итоговых данных рабочей таблицы 3 можно построить итоговую таблицу 4 аналитической группировки.

Таблица 2.4 Зависимость выработки изделий работниками от их производственного стажа

Группы работников по производственному стажу, г. Число работников
Выработка изделий, шт.
В целом по группе В среднем на одного работника
А 1 2 3
2-55-88-11 452 284222 4,0008,40011,000
Итого 11 92

Групповые средние

и общую среднюю
результативного признака определим по формуле простой средней арифметической.

Анализ таблицы показывает (см. гр А и 3 табл. 4), что с ростом производственного стажа от группы возрастает и средняя выработка работников. Следовательно, между производственным стажем и выработкой работников существует прямая корреляционная взаимосвязь.

2. Корреляционная таблица – это специальная комбинационная таблица, в которой представлена группировка по двум взаимосвязанным признакам: факторному и результативному.

Концентрация частот около диагоналей матрицы данных свидетельствует о наличии и направлении (прямая, обратная) корреляционной связи между признаками. Построим корреляционную таблицу.

Для этого определим величины интервалов группировки и интервалы по факторному и результативному признакам

интервалы 2-5, 5-8, 8-11.

шт; интервалы: 6-8, 8-10, 10-12.