В интервальном вариационном ряду для определения медианы сначала нужно найти медианный интервал – первый по счету интервал, в котором накопленная частота равна или превышает полусумму частот вариационного ряда. После этого медиана определяется по формуле
,где
– нижняя граница медианного интервала; – величина медианного интервала; – накопленная частота интервала, предшествующего медианному; – частота медианного интервала.Пример. По данным примера 5.3 определить медиану интервального ряда.
Медианным является интервал (1500-1600), так как это первый по счету интервал, сумма накопленных частот которого (115) больше полусуммы накопленных частот интервального ряда (0.5∙210 = 105). Подставив данные примера в формулу для медианы интервального ряда, получим
.В математической статистике используют структурные характеристики, делящие вариационный ряд на большее число частей, – квантили – показатели дифференциации признаков по частотам. Различают несколько видов квантилей.
Квартили – значения признака, которые делят вариационный ряд на четыре равные части. Второй квартиль равен медиане, первый и третий вычисляются аналогично расчету медианы. При расчете i-го квартиля сначала по относительным частотам определяют соответствующий квартильный интервал – первый по счету интервал, накопленная частота которого больше
(n – сумма частот). Затем значение квартиля рассчитывают по формуле, аналогичной формуле для нахождения медианы , i =1, 2, 3,где i– номер квартильного интервала;
– нижняя граница i-го квартильного интервала; – величина i-го квартильного интервала; – накопленная частота интервала, предшествующего i-му квартильному интервалу; – частота i-го квартильного интервала.Отношение третьего и первого квартилей называется квартильным коэффициентом
=и показывает, во сколько раз значение признака у четверти вариантов, имеющих наибольшие значения признака, превышает значение признака у другой четверти с наименьшими значениями.
Значения признака, которые делят вариационный ряд на десять равных частей, называются децилями. Расчет значений децилей проводится аналогично расчету квартилей. Отношение девятого и первого децилей – децильный коэффициент
= показывает, во сколько раз величина признака у 10% совокупности с наибольшими значениями превышает такую же величину у 10% совокупности с наименьшими значениями признака.В статистике используются также перцентили – значения признака, которые делят вариационный ряд на сто равных частей.
В ряде случаев в математической статистике вычисляют показатели формы распределения частот по вариантам: асимметрию и эксцесс. Характеристика симметричности распределения – коэффициент асимметрии – рассчитывается по формуле
где
– центральный момент третьего порядка; – куб среднего квадратического отклонения.Если варианты распределены симметрично относительно средней величины
, т.е. равноудаленные от варианты имеют одинаковые частоты, коэффициент асимметрии равен нулю. Если < 0, в вариационном ряду преобладают варианты, которые меньше, чем средняя величина. В этом случае говорят о наличии левосторонней асимметрии. И, наоборот, при > 0 преобладают варианты, которые больше . Это указывает на правостороннюю симметрию.Пример. Рис. 1 иллюстрирует зависимость вида кривой распределения от асимметрии.
Номер группы | i | 1 | 2 | 3 | 4 | 5 | 6 |
Число посетителей | хi | 60 | 65 | 70 | 75 | 100 | 120 |
Частота | ni | 3 | 3 | 9 | 8 | 11 | 6 |
Относительная частота | pi* | 0.075 | 0.075 | 0.225 | 0.2 | 0.275 | 0.15 |
Рис.4
Построим эмпирическую функцию распределения. Исходными данными для её построения являются множество значений признака и множество относительных частот:
хi | 50 | 60 | 65 | 70 | 75 | 100 | 120 | ||
pi* | 0 | 0.075 | 0.075 | 0.225 | 0.2 | 0.275 | 0.15 | ||
xi | 50 | 60 | 65 | 70 | 75 | 100 | 120 | ||
Pi* | 0 | 0,075 | 0,075 | 0,225 | 0,200 | 0,275 | 0,150 | ||
F ( xi ) | 0 | 0,075 | 0,15 | 0,375 | 0,575 | 0,85 | 1 |