Смекни!
smekni.com

Анализ эмпирического распределения (стр. 4 из 5)

Таблица 5.3 Сравнение статистических показателей, рассчитанных различными способами

Название показателя Значение в ППП Statistica Значение после ручного расчета
1. Средняя арифметическая 153,055 152,95
2. Медиана 153,45 154,09
3. Мода 161,70 155,14
4. Дисперсия 1730,257 1973,99
5. Нижний квартиль 135,85 128,65
6. Верхний квартиль 172,75 175,84

6. СГЛАЖИВАНИЕ ЭМПИРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ.

ПРОВЕРКА ГИПОТЕЗЫ О ЗАКОНЕ РАСПРЕДЕЛЕНИЯ

Одна из важнейших задач анализа вариационных рядов заключается в выявлении закономерности распределения и определении ее характера. Основной путь в выявлении закономерности распределения – построение вариационных рядов для достаточно больших совокупностей. Важное значение для выявления закономерности распределения имеет правильное построение самого вариационного ряда: выбор числа групп и размера интервала варьирующего признака.

Говоря о характере, типе закономерности распределения, имеем в виду отражение в нем общих условий вариации. При этом речь всегда идет о распределениях качественно однородных явлений. Общие условия, определяющие тип закономерности распределения, познаются анализом сущности явления, тех его свойств, которые определяют вариацию изучаемого признака. Следовательно, должна быть выдвинута какая-то научная гипотеза, обосновывающая тип теоретической кривой распределения.

Под теоретической кривой распределения понимается графическое изображение ряда в виде непрерывной линии изменения частот в вариационном ряду, функционально связанного с изменением вариантов (значений признака).

Теоретическое распределение может быть выражено аналитически – формулой, которая связывает частоты вариационного ряда и соответствующие значения признака. Такие алгебраические формулы носят название законов распределения[6].

Процедура выравнивания, сглаживания анализируемого распределения заключается в замене эмпирических частот теоретическими, определяемыми по формуле теоретического распределения, но с учетом фактических значений переменной. На основе сопоставления эмпирических и теоретических частот рассчитываются критерии согласия, которые используются для проверки гипотезы о соответствии исследуемого распределения тому или иному типу теоретического распределении.

Для проверки статистической гипотезы о законе распределения будем использовать критерий

– критерий Пирсона (Chi-square test). Расчет критерия производится по следующей формуле:

(6.1)

где:

– эмпирические абсолютные частоты (Observed Frequency);
– абсолютные частоты теоретического распределения (Expected Frequency); k – число интервалов.

С помощью ППП Statistica проведем сглаживание рассматриваемого распределения и проверим статистическую гипотезу о законе распределения.

Рис. 6.1. Проверка гипотезы о нормальном распределении переменной Var1


Для сглаживания эмпирического распределения переменной Var1 нормальным распределением необходимо использовать формулы, приведенные ниже.

Функция нормального распределения:

(6.2)

Плотность нормального распределения определяется по формуле:

(6.3)

где:х – значение изучаемого признака;

– средняя арифметическая величина;
– среднее квадратическое отклонение изучаемого признака;
– математические константы;
– нормированное отклонение.

Теоретические частоты нормального распределения рассчитываются по следующей формуле:

(6.4)

где:N – объем совокупности; h – величина интервала.

Из рис. 6.1. видно, что критерий

для нормального распределения составил 5,42808 при количестве степеней свободы 2 и расчетном уровне значимости 0,06627.

Для принятия решения о справедливости гипотезы о законе распределения необходимо сравнить рассчитанный критерий

с критическим значением.

Табличное значение

для степеней свободы r=2 и уровня значимости α=0,05 составляет 5,991. Поскольку рассчитанное значение
меньше табличного, то гипотеза о нормальном распределении переменной Var1 не противоречит статистическим данным.

На рис. 6.2 показана гистограмма эмпирического распределения и расчетная кривая нормального распределения для исследуемой переменной.

Рис. 6.2. Гистограмма и расчетная кривая нормального распределения для переменной Var1

В табл. 6.1 приведен расчет теоретических частот для сглаживания эмпирических данных нормальным распределением.

Расчетное значение критерия Пирсона составило

. Табличное значение критерия –
.

Таблица 6.1 Расчет критерия

вручную
1. 19,31 49,69 34,50 -2,666 0,0114 1 1,000
2. 49,69 80,06 64,87 -1,982 0,0559 3 0,000
3. 80,06 110,43 95,24 -1,299 0,1716 9 1,000
4. 110,43 140,80 125,61 -0,615 0,3302 18 0,500
5. 140,80 171,17 155,99 0,068 0,3980 23 3,522
6. 171,17 201,54 186,36 0,752 0,3007 16 0,563
7. 201,54 231,91 216,73 1,436 0,1424 8 2,000
8. 231,91 262,29 247,10 2,119 0,0422 2 4,500
Итого: 13,084

Очевидно, что расчетное значение критерия превышает критическое, следовательно гипотеза о нормальном распределении подтверждена (табл. 6.2).

Таблица 6.2 Проверка гипотезы о нормальном законе распределения вручную

Тип распределения Число степеней свободы r Расчетное значение критерия
Табличное значение критерия
Нормальное 7 13,084 14,07

Рассмотрим также гипотезы о логнормальном и прямоугольном распределении (рис. 6.2 и рис. 6.3).

Из рис. 6.2 видно, что критерий

для логнормального распределения равен 16,48145 при количестве степеней свободы r=3 и уровне значимости 0,0009.

Рис. 6.2. Проверка гипотезы о логарифмически нормальном распределении переменной Var1

Сопоставим рассчитанные показатели с табличным значением критерия Пирсона:

Очевидно, что расчетное значение критерия Пирсона превышает критическое, а расчетная вероятность ниже табличного уровня значимости. Следовательно, гипотеза о логнормальном распределении вариационного ряда не может быть принята.

На рис. 6.3 приведена гистограмма и расчетная кривая логнормального распределения переменной Var1.

На рис. 6.4 приведена таблица расчета теоретических частот и критерия Пирсона для прямоугольного распределения.

Таким образом, расчетный критерий Пирсона для прямоугольного распределения составил 54,48687 при количестве степеней свободы 5 и вероятности 0,00: