2. Нахождение моды и медианы полученного интервального ряда распределения графическим методом и путем расчетов
Для определения моды графическим методом строим по данным таблицы 4 (графы 2 и 3) гистограмму распределения регионов по изучаемому признаку.
Рис. 1. Определение моды графическим методом
Расчет конкретного значения моды для интервального ряда распределения производится по формуле:
(3)где хМo – нижняя граница модального интервала,
h – величина модального интервала,
fMo – частота модального интервала,
fMo-1 – частота интервала, предшествующего модальному,
fMo+1 – частота интервала, следующего за модальным.
Согласно таблице 4 модальным интервалом построенного ряда является интервал 480 - 610 тыс. чел., т.к. он имеет наибольшую частоту (f3 = 11). Расчет моды:
Вывод: Для рассматриваемой совокупности регионов наиболее распространенная численность занятых в экономике характеризуется средней величиной 523 тыс. человек.
Для определения медианы графическим методом строим по данным таблицы 5 (графы 2 и 5) кумуляту распределения регионов по изучаемому признаку.
Рис. 2. Определение медианы графическим методом
Расчет конкретного значения медианы для интервального ряда распределения производится по формуле
, (4)где хМе – нижняя граница медианного интервала,
h – величина медианного интервала,
– сумма всех частот,fМе – частота медианного интервала,
SMе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному.
Определяем медианный интервал, используя графу 5 таблицы 5. Медианным интервалом является интервал 480 - 610 тыс. чел., т.к. именно в этом интервале накопленная частота Sj = 24 впервые превышает полу сумму всех частот (
).Расчет медианы:
Вывод: В рассматриваемой совокупности регионов половина регионов имеют численность занятых в экономике не более 539 тыс. человек, а другая половина – не менее 539 тыс. человек.
Расчет характеристик ряда распределения
Для расчета характеристик ряда распределения
, σ, σ2, Vσ на основе таблицы 5 строим вспомогательную таблицу 6 ( – середина интервала). Таблица 6 - Расчетная таблица для нахождения характеристик ряда распределения | ||||||
Группы регионов по величине численности занятых в экономике, тыс. чел. (x) | Середина интервала, | Число регионов, fj |
|
|
|
|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
220 - 350 | 285 | 4 | 1 140 | - 260 | 67 600 | 270 400 |
350 - 480 | 415 | 9 | 3 735 | - 130 | 16 900 | 152 100 |
480 - 610 | 545 | 11 | 5 995 | 0 | 0 | 0 |
610 - 740 | 675 | 7 | 4 725 | 130 | 16 900 | 118 300 |
740 - 870 | 805 | 5 | 4 025 | 260 | 67 600 | 338 000 |
Всего | --- | 36 | 19 620 | --- | --- | 878 800 |
Рассчитаем среднюю арифметическую взвешенную:
(5)Рассчитаем среднее квадратическое отклонение:
(6)Рассчитаем дисперсию:
σ2 = 156,24052 = 24 411,0938
Рассчитаем коэффициент вариации:
(7)Вывод: Анализ полученных значений показателей
и σ говорит о том, что средняя величина численности занятых в экономике составляет 545 тыс. чел., отклонение от этой величины в ту или иную сторону составляет в среднем 156 тыс. чел. (или 28,7%), наиболее характерная численность занятых в экономике находится в пределах от 389 до 701 тыс. чел. (диапазон ).Значение Vσ = 28,7% не превышает 33%, следовательно, вариация численности занятых в экономике в исследуемой совокупности регионов незначительна и совокупность по данному признаку однородна. Расхождение между значениями
, Мо и Ме незначительно ( = 545 тыс. чел., Мо = 523 тыс. чел., Ме = 539 тыс. чел.), что подтверждает вывод об однородности совокупности регионов. Таким образом, найденное среднее значение численности занятых в экономике (545 тыс. чел.) является типичной, надежной характеристикой исследуемой совокупности регионов.Вычисление средней арифметической по исходным данным о численности занятых в экономике регионов
Для расчета применяется формула средней арифметической простой:
, (8)Причина расхождения средних величин, рассчитанных по исходным данным (546,67 тыс. чел.) и по интервальному ряду распределения (545 тыс. чел.), заключается в том, что в первом случае средняя определяется по фактическим значениям исследуемого признака для всех 36-ти регионов, а во втором случае в качестве значений признака берутся середины интервалов и, следовательно, значение средней будет менее точным. Вместе с тем, при округлении обеих рассматриваемых величин их значения практически совпадают, что говорит о достаточно равномерном распределении численности занятых в экономике внутри каждой группы интервального ряда.
Задание 2.
По исходным данным (таблицы 1) с использованием результатов выполнения Задания 1 необходимо выполнить следующее:
1. Установить наличие и характер корреляционной связи между признаками Численность занятых в экономике и Валовой региональный продукт, образовав пять групп с равными интервалами по каждому из признаков, используя методы:
а) аналитической группировки;
б) корреляционной таблицы.
2. Измерить тесноту корреляционной связи, используя коэффициент детерминации и эмпирическое корреляционное отношение.
Сделать выводы по результатам выполнения задания 2.
Выполнение задания 2
Целью выполнения данного задания является выявление наличия корреляционной связи между факторным и результативным признаками, а также установление направления связи и оценка ее тесноты.
По условию Задания 2 факторным является признак Численность занятых в экономике, результативным – признак Валовой региональный продукт.
1. Установление наличия и характера корреляционной связи между признаками Численность занятых в экономике и Валовой региональный продукт методами аналитической группировки и корреляционных таблиц