На основании Приложения 3 приведём имеющиеся данные в систему по интересующему нас признаку. В качестве изучаемого признака возьмём, например, число автобусов общего назначения негосударственной формы собственности и построим по нему ряд распределения.
1. Определим число групп по формуле Стерджесса (1)
(1)n =7
2. Определим величину интервала (2)
(2)i = 14,14
Далее образуем группы областей отстающих друг от друга на количество автобусов общего назначения негосударственной формы собственности на 100000 человек населения равную 14.14.
Таблица 3.
Группы областей по количеству автобусов негосударственной формы собственности на 100000 человек населения
№ | Группы областей по количеству автобусов. | Количество областей, шт | Удельный вес областей группы в % к итогу |
1 | [0-14,14) | 55 | 64.7 |
2 | [14,14-28,28) | 14 | 16.47 |
3 | [28,28-42,42) | 7 | 8.24 |
4 | [42,42-56,56) | 3 | 3.53 |
5 | [56,56-70,7) | 0 | 0 |
6 | [70,7-84,84) | 5 | 5.88 |
7 | [84,84-99] | 1 | 1.18 |
итого | 85 | 100 |
Распределив области по группам, подсчитаем число областей в каждой группе.
Вывод: ряд распределения показывает, что для данной отрасли, характерной является группа областей с количеством автобусов негосударственной формы собственности на 100000 человек населения от 0 до 14,14, что составляет 64,7% всех областей.
2.3 Определение структурных средних
1.) Мода - это числовое значение признака которое наиболее часто встречается в ряду распределения. Может определяться для дискретного и интервального ряда.
На основании данных таблицы 4 рассчитаем моду.
Для интервальных рядов распределения мода рассчитывается по формуле 3
(3)Модальный интервал 0-14,14, так как для него характерна наибольшая частота (количество областей).
Вывод: Область, имеющая количество автобусов негосударственной формы на 100000 человек в размере 8,1 представляет собой наибольшую группу в общем объёме рассматриваемых областей.
2.) Медиана – величина признака, которая делит упорядоченную последовательность его значений на две равные по численности части со значениями меньше медианы и больше медианы. Рассчитывается для дискретных и интервальных рядов.
На основании данных таблицы 4, рассчитаем медиану.
Для интервальных рядов распределения медиана рассчитывается по формуле 4
(4)Определяем полусумму накопленных частот:
Для каждого интервала определяем сумму накопленных частот, для этого построим вспомогательную таблицу 4.
Таблица 4.
Группы областей по количеству автобусов негосударственной формы собственности на 100000 человек населения
№ | Группы областей по количеству автобусов | Количество областей, шт | Сумма накопленных частот |
1 | [0-14,14) | 55 | 55 |
2 | [14,14-28,28) | 14 | 69 |
3 | [28,28-42,42) | 7 | 76 |
4 | [42,42-56,56) | 3 | 79 |
5 | [56,56-70,7) | 0 | 79 |
6 | [70,7-84,84) | 5 | 84 |
7 | [84,84-99] | 1 | 85 |
итого | 85 |
Медиана находиться в том интервале, в котором сумма накопленных частот впервые превышает полусумму (1 интервал).
Вывод: Из 85 областей 42 имеют количество автобусов негосударственной формы собственности на 100000 человек населения менее 10,926, остальные более этого значения.
2.4. Расчет показателей вариации
Таблица 5
Динамический ряд данных о количестве округов РФ, сгруппированных по количеству автобусов общего пользования
Группы округов РФпо количеству автобусов общего пользования | 30-40 | 40-50 | 50-60 |
Количество округов РФ | 1 | 1 | 5 |
Построим график ряда распределения рисунок 2.
Рисунок 2. Группировка округов РФ по количеству автобусов на 100 тыс. человек.
По ряду распределения (таблица 5) рассчитаем характеристики ряда. Для этого составим таблицу, которая поможет в расчетах – таблица 6.
1) Размах вариации (5) - это мера колебленности, которая показывает на сколько велико различие между единицами совокупности, имеющими самое минимальное и самое максимальное значения признака.
(5)R= 60-30=30
Таблица 6.
Распределение округов РФ по количеству автобусов на 100 тыс. человек
№ | Группы округов РФ по количеству автобусов на 100 тыс. человек | Кол-во округов f | Сериди-на интер-вала x | ||||
1 | 30-40 | 1 | 35 | 15,714 | 15,714 | 246,93 | 246,93 |
2 | 40-50 | 1 | 45 | 5,714 | 5,714 | 32,65 | 32,65 |
3 | 50-60 | 5 | 55 | 4,286 | 21,43 | 18,37 | 91,85 |
Итого: | 7 | 42,858 | 371,43 |
2) Среднее линейное отклонение – среднее из абсолютных значений отклонений отдельных вариаций от их средних. В данном случае применяется взвешенная формула (6).
(6)Сначала найдем
=6,123 ( по формуле 6)3) Среднее квадратическое отклонение – это обобщающая характеристика размеров вариации в совокупности. Применяем взвешенную формулу (7).
(7) 7,284)Коэффициент вариации
(8)Коэффициент вариации имеет критически допустимое значение 33%:
если
10%, то колебленность признака слабая.От 10 до 20% - колебленность умеренная;
от 20 до 33% - колебленность высокая.
14,36%5) Коэффициент осцилляции– показывает относительную колеблемость крайних значений признака относительно средней:
(9)
Вывод: изучаемая совокупность является однородной, так как 14,36% < 33%, колебленность признака умеренная.
2.5. Корреляционный анализ. Изучение тесноты связи.
Построим корреляционную таблицу(таблица7) – это специальная комбинационная таблица, в которой представлена группировка по двум взаимосвязанным признакам факторным и результативным. Воспользуемся Приложением №5
Таблица 7
Статистика дорожно-транспортных происшествий и пострадавших в них (на 100000 человек населения); (2002 год)
№ | Название федерального округа РФ | Число происшествий , x | Пострадало в происшествиях, чел., y | xy | x | Y |
1 | Центральный | 135,15 | 27,75 | 3750,41 | 18265,52 | 23,39 |
2 | Северо-Западный | 135,25 | 20,93 | 2830,78 | 18292,56 | 23,4 |
3 | Южный | 91,7 | 20,11 | 1844,09 | 8408,89 | 20,6 |
4 | Приволжский | 114,42 | 21,74 | 2487,49 | 13091,94 | 22,06 |
5 | Уральский | 144,02 | 22,15 | 3190,04 | 20741,76 | 23,96 |
6 | Сибирский | 114,25 | 22,65 | 2587,76 | 13053,06 | 22,05 |
7 | Дальневосточный | 137,35 | 23,64 | 3246,95 | 18865,02 | 23,53 |
Итого: | 872,14 | 158,97 | 19937,52 | 110718,75 | 158,99 |