2. Произвести аналитическую группировку статистических данных, выбрав в качестве факторного признака возраст оборудования, результативного признака – эксплуатационные расходы. Для проведения такой группировки рекомендуется создать четыре группы станков по возрасту: от 1 года до 5, от 6 до 10, от 2 до 15, от 15 до 20 (станков старше 20 лет нет ни в одном цехе). В каждой образованной по возрасту группе найти средние по группе эксплуатационные расходы. Результаты группировки представить в табличном виде. Макеты необходимых таблиц приведены в приложении. Эти же данные представить в виде набора из четырех гистограмм, показывающих распределение оборудования по возрасту на каждом из объектов наблюдения. По результатам построения таблиц и гистограмм сделать выводы. Определить моду возраста оборудования для каждого набора данных расчетным путем и графически.
3. Для каждого набора данных определить коэффициент Фехнера, построить поле корреляции, рассчитать коэффициент корреляции и определить, для какого цеха наблюдается более тесная связь между возрастом оборудования и величиной эксплуатационных издержек. Для каждого объекта получить уравнение линии регрессии, показывающей характер связи между возрастом оборудования и эксплуатационными расходами (связь считать прямолинейной). По полученным уравнениям сделать выводы о том, на каком объекте наблюдения быстрее возрастают с возрастом эксплуатационные расходы.
Указания к выполнению РГР
Средние величины
Для описания статистических данных одним из наиболее простых и эффективных методов является метод средних величин. По отдельным значениям статистического признака хi, полученным в результате наблюдения, возможно получить среднюю величину, рассчитываемую по различным правилам и характеризующую одним лишь числом всю изучаемую совокупность данных. Для выполнения РГР используется среднее арифметическое, вычисляемое по правилу
,где хi – отдельные значения признака, полученные в результате наблюдения; n – общее число наблюдений.
Для описания того, как далеко отдельные значения признака хi отстоят от полученного среднего арифметического
или, иными словами, для описания рассеяности изучаемой совокупности, используют величину, называемую средним квадратическим отклонением. Величина среднего квадратического отклонения рассчитывается по формуле ,где хi – отдельные значения признака;
– среднее арифметическое; n –общее число наблюдений.В случае, когда необходимо сравнить между собой две статистические совокупности и сказать, какая из них рассеяна меньше и обладает соответственно большей однородностью наблюдений, используют характеристику рассеяния, называемую коэффициентом вариации. Пусть необходимо сравнить две статистические совокупности:
х со значениями признака хi
;У со значениями признака уi
.Для нахождения коэффициентов вариации предварительно определяются:
– среднее арифметическое для совокупности X; – среднее арифметическое для совокупности У;Sx – среднее квадратическое отклонение для совокупности X;
Sy – среднее квадратическое отклонение для совокупности У.
Коэффициенты вариации находятся по формулам:
– коэффициент вариации для совокупности х; – коэффициент вариации для совокупности У.Коэффициент вариации позволяет сопоставить между собой статистические совокупности, у которых значения признака измеряются в разных единицах измерения. Так, например, можно сравнить, что на предприятии изменяется больше – величина заработной платы рабочих или производительность труда. Чем меньше коэффициент вариации, тем более однородной является изучаемая статистическая совокупность. Принято считать, что при коэффициенте вариации более 10 процентов изучаемая совокупность не является однородной и для ее достоверного описания необходимо по какому-либо признаку выделять группы, обладающие большей однородностью. Рассматривая, например, среднюю заработную плату рабочих цеха, рассчитывая коэффициент вариации заработной платы и получив его достаточно большим (много больше 10 процентов), можно попытаться выделить в изучаемой совокупности две группы рабочих: основные рабочие и вспомогательные. По каждой из этих групп определяется средняя заработная плата, вариация признаков в каждой группе меньше (меньше должны быть коэффициенты вариации), и полученные средние более достоверно будут характеризовать изучаемую совокупность статистических данных.
Еще одной из характеристик изучаемой совокупности является медиана Ме – число, делящее упорядоченную по возрастанию совокупность значений признака на две равные части, у одной части значение признака меньше медианы, у другой части – больше.
Пример: значения признака выражены числами 2, 2, 4, 5, 7, 9, 10. Медианой является число 5, три значения признака в этой совокупности меньше 5, три значения больше 5. В случае четного числа значений признака:
2, 2, 4, 5, 7, 9, 10, 11 медианой является число
, делящее рассматриваемую совокупность на 2 части. При этом четыре значения признака меньше 6, четыре значения – больше.В РГР предлагается определить для каждого объекта наблюдения медиану возраста оборудования – возраст, который превысила уже половина станочного парка.
Метод группировок
Для выяснения закономерностей, существующих в изучаемой совокупности, и для установления возможной связи между различными признаками используют метод группировок. Группировка – процесс разделения статистической совокупности на группы, однородные в каком-либо отношении либо имеющие одинаковые или близкие значения группировочного признака. Так, например, всю совокупность станочного парка предприятия можно разбить на группы по признаку "возраст", образовав группы станков: от 1 до 5 лет, от 6 до 10, от 2 до 15 и от 16 до 20 лет. Здесь в качестве группировочного признака выбран возраст и созданы группы, имеющие близкое значение группировочного признака. Подсчитав число станков, попавших в каждую группу, можно сделать выводы о распределении станков по возрасту. По каждой выделенной группе далее можно рассчитать значения других признаков, характеризующих станки. Например – среднее по группе число часов простоев за год, средние по группе эксплуатационные расходы, общее число текущих ремонтов за период и др. Выполнив подобные расчеты, можно посмотреть, как с увеличением возраста станков от группы к группе меняется второй признак.
Группировки подобного рода, сопоставляющие два признака, называются аналитическими. Тот признак, который оказывает влияние на другой, называется факторным, а тот, на котором отражается воздействие факторного признака, называется результативным. Если при увеличении факторного признака результативный увеличивается, то говорят о наличии прямой связи между двумя изучаемыми признаками, если при увеличении факторного признака результативный уменьшается, то говорят об обратной связи. Однако проведение аналитической группировки позволяет лишь установить факт наличия связи, а степень тесноты связи, ее форму изучают более сложными методами, изложенными в следующем разделе.
Результаты выполнения группировки, показывающей структуру станочного парка по возрасту, удобно представить в следующем виде (табл. 6).
Таблица 6
Распределение станочного парка по возрасту
Группы по возрасту, лет | Число станков в группе, шт | В процентах к итогу |
от 1 до 5 | 5 | 14.29 |
от 6 до 10 | 16 | 45.71 |
от 2 до 15 | 10 | 28.57 |
от 16 до 20 | 4 | 11.43 |
Графический способ представления этих же данных – гистограмма. Гистограмма строится в прямоугольной системе координат, где по оси абсцисс откладываются отрезки, изображающие, в каких пределах изменяются значения изучаемого признака, а по оси ординат на отложенных отрезках вплотную друг к другу строятся прямоугольники, показывающие, сколько значений признака при его группировке попадают на тот или иной интервал. При этом площади прямоугольников изображаются пропорционально количеству значений признака, попавшему на каждый из интервалов, отложенных по оси абсцисс. В случае равной величины интервалов, откладываемых по оси X, высоты прямоугольников изображаются пропорционально количеству значений признака, попавших на каждый интервал.