Диаграмма “Hanging Bars”
Рис.1.10
HH-процедура выводит на экран изображение близкое к гистограмме, с тем только различием, что столбцы гистограммы не опираются на горизонтальную ось, а "подвешены" (Hanging) к кривой нормального распределения в точках, соответствующих серединам интервалов группировки.
2. Расчет основных характеристик вариационного ряда
Статистический анализ вариационных рядов распределения предполагает расчет характеристик центра распределения, его структуры, оценку степени вариации и дифференциации изучаемого признака, изучение формы распределения.
В качестве показателей центральной тенденции распределения используются: среднее арифметическое значение, мода и медиана. Основными показателями вариации являются: размах вариации, дисперсия, среднее квадратическое отклонение, коэффициент вариации. Для характеристики структуры распределения используются следующие показатели: медиана, квартили, децили и прочие перцентили. Изучение формы распределения предполагает оценку асимметрии и эксцесса (куртозиса). Перечисленные показатели имеют самостоятельное аналитическое значение, поскольку отражают разные свойства изучаемой совокупности, а все вместе они позволяют получить комплексную характеристику эмпирического распределения.
В программе STATISTICA, как и в других статистических ППП, есть возможность получить все перечисленные показатели, пользуясь одной процедурой. В главном меню раздел Statistics, активизируем опцию Basic Statistics/Tables. Затем, в появившемся контекстном окне, выбирается процедура Descriptive statistics – описательные статистики. Закладка Advanced предлагает пользователю сформировать набор вычисляемых статистик, отвечающих целям анализа.
Ниже приведены результаты расчета основных статистических характеристик.
Табл.2.1
Основные характеристики распределения регионов России по значению
показателя «Число собственных легковых автомобилей на 1000 человек» в 2001 г.
Valid N – объем выборки (число единиц в совокупности). У нас 84 региона.
Mean – средняя арифметическая.
,где n – объем совокупности (число единиц);
Хi – значение признака у I-ой единицы совокупности.
Средняя арифметическая величина – отношение объема признака к объему совокупности. Данная средняя используется для расчета средних значений абсолютных показателей по не сгруппированным данным.
Median – медиана. Это значение признака у единицы, делящий ранжированный ряд пополам.
Mode – мода определяется непосредственно по исходным данным (запись в строке Multiple означает, что распределение имеет не одну моду). Это наиболее часто встречающееся значение признаков совокупности.
Frequency – частота модального значения.
Sum – сумма значений признака в совокупности.
Variance – дисперсиия.
Показатель дисперсии в экономических исследованиях содержательно не интерпретируется, но благодаря своим свойствам широко используется для расчета многих статистических характеристик.
Standard deviation – среднее квадратическое (стандартное) отклонение.
Minimum – минимальное значение признака в совокупности: x min .
Maximum – максимальное значение признака в совокупности: x max.
Range – размах вариации.
Lower (Lower quartile) –нижний (первый) квартиль.
Upper (Upper quartile)–верхний (третий) квартиль.
Quartile (Interquartile range) – межквартильныйразмах: Q3 – Q1.
Skewness–асимметрия.
Табл.2.2
Сравнение статистических показателей, рассчитанных
различными способами
№ п/п | Показатель | Значение в ППП STATISTICA | Значение после ручного расчета |
1 | Средняя арифметическая | 122,2202 | 122,2202 |
2 | Мода | Multiple | Multiple |
3 | Медиана | 120,0000 | 120,0000 |
4 | Дисперсия | 1239,130 | 1239,130 |
5 | Среднее квадратическое отклонение | 35,20128 | 35,20128 |
6 | Частота модального значения | 2 | 2 |
7 | Сумма значений признака | 10266,50 | 10266,50 |
8 | Верхний квартиль | 140,7000 | 140,7000 |
9 | Нижний квартиль | 105,6000 | 105,0000 |
Среди рассчитанных характеристик нет такого важного показателя вариации, как коэффициент вариации (принято рассчитывать в процентах):
В нашем случае коэффициент вариации равен:
V = (35,20128/122,2202)*100 = 28,8 %.
Заключение
В данном курсовом проекте была рассмотрена реализация анализа распределений с использованием программы STATISTICA, а также произведены расчеты основных статистических показателей.
Таким образом, по итогам курсового проекта я освоила методику и приобрела практические навыки анализа распределений, включающего расчет основных статистических характеристик, графическое и табличное представление рядов распределения.