2.2. Показатели колеблемости признака.
Для измерения колеблемости признака применяются абсолютные и относительные показатели вариации.
Размах вариации - это разность между максимальным и минимальным значениями изучаемого признака.
R= xmax-xmin
Среднее линейное отклонение- средняя арифметическая из модулей абсолютных отклонений вариантов от их среднего значения.
Дисперсия- это средний квадрат отклонений вариантов от их средней арифметической.
Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии.
Относительное линейное отклонение – отношение среднего линейного отклонения к средней:
.Коэффициент вариации – отношение среднего квадратического отклонения к средней:
.2.3. Показатели формы распределения.
В статистике широко известны различные виды распределений - нормальное распределение, биноминальное, распределение Пуассона и др. Наиболее употребительным является нормальное распределение, выражающее закономерности взаимодействия случайных величин. Оно служит удачной моделью, с которой сравнивают анализируемое эмпирическое распределение. Если расхождения не велики, то их объясняют действием случайных факторов и считают данное распределение близким к нормальному. В противном случае делают вывод о несоответствии рассматриваемого распределения нормальному.
Чтобы определить, насколько близко эмпирическое распределение к нормальному, необходимо произвести выравнивание фактического распределения по кривой нормального распределения. С этой целью рассчитываются теоретические частоты по формуле:
,где
– теоретические частоты; - фактические частоты; - шаг (величина интервала); - нормированные отклонения; - дифференциальная функция Лапласа (значения даны в приложении 1).2.5. Проверка гипотезы о законе нормального распределения.
Для объективной оценки степени соответствия эмпирического распределения теоретическому используется ряд особых показателей, называемых критериями согласия. На их базе проверяется гипотеза о законе нормального распределения. Это критерии Пирсона, Колмогорова, Смирнова и др. Мы рассмотрим критерий Пирсона.
Критерий Пирсона определяется по формуле:
Рассчитанное значение сравнивается с табличным при соответствующем числе степени свободы и заданном уровне значимости. Если расчетное значение χ2 меньше табличного, то делается вывод о несущественности расхождений между эмпирическим и теоретическим распределении (т.е. нулевая гипотеза о том, что распределение подчиняется закону нормального распределения, принимается).
Рассматриваемые критерии согласия дают общую оценку степени близости эмпирического распределения к нормальному, но не дают информации о характере расхождения между ними. Для определения характера расхождения между эмпирическими и теоретическими частотами определим показатели формы распределения. Это коэффициент асимметрии и эксцесса.
Коэффициент асимметрии рассчитывается по формуле:
При симметрическом распределении КА= 0. При КА> 0 - наблюдается положительная или правосторонняя асимметрия (правая часть кривой длиннее).
Примечание. Коэффициент асимметрии находится в интервале:
-3 < КА < 3.
Островершинность распределения характеризуется при помощи коэффициента эксцесса:
где m4 - центральный момент четвёртого порядка;
При Ex> 0 кривая распределения – плосковершинна, при Ex<= 0 – островершинна.
2.7. Статистические оценки параметров распределения.
Изучаемую совокупность можно считать выборкой из генеральной совокупности. По данным выборки производится оценка параметров генеральной совокупности.
Статистической оценкой называется специальная функция, вычисляемая на основании выборочных данных для приближенной замены неизвестного параметра распределения или самого распределения. Различают оценки смещённые и несмещённые, точечные и интервальные.
Возможное расхождение между выборочными и генеральными характеристиками составляет ошибку выборки.
Стандартная ошибка выборочной средней определяется по формуле:
Ошибка среднего квадратического отклонения
Ошибка коэффициента вариации
Точечной, несмещённой и состоятельной оценкой генеральной средней является выборочная средняя
Для определения интервальной оценки необходимо найти доверительный интервал
, ,где
- предельная ошибка выборочной средней; - коэффициент доверия, который определяют по таблице распределения Стьюдента по заданным и при малой выборке при n <= 30 (приложение 3).Достоверность любого параметра оценивается по критерию достоверности t, определяемого как отношение оцениваемого параметра к ошибке. Если tфакт > tкр, определяемого по таблице распределения Стьюдента, то данный параметр достоверен.
Достоверность выборочной средней:
Достоверность среднего квадратического отклонения и коэффициент вариации:
и
Определяется по формуле:
Если данная величина меньше 5%, то полученные средние можно использовать в последующих расчётах характеристик изучаемой совокупности.
Вывод:
Характер расхождения между эмпирическими и теоретическими частотами:
· Коэффициент асимметрии КА> 0 для параметра У, следовательно у него наблюдается положительная или правосторонняя асимметрия (правая часть кривой длиннее), для параметра Х КА>0, следовательно у него наблюдается отрицательная или левосторонняя ассиметрия.
· Коэффициент эксцесса Ex> 0 для Х и У, значит кривая распределения – плосковершинная.
Стандартная ошибка выборки максимально возможные расхождения между генеральными и выборочными характеристиками. 0,0343 дляпараметраХи 3,2168 – для У.
Относительная ошибка выборки для параметров Х и У меньше 5 %, значит полученные средние можно использовать для характеристики каждого из этих признаков.
Глава 3. Корреляционно – регрессионный анализ.
3.1. Выбор типа аппроксимирующей функции
В экономических исследования редко приходится иметь дело с точными и определенными функциональными связями, когда каждому значению одной величины соответствует строго определённое значение другой величины. Чаще встречаются стохастические (вероятностные) или корреляционные связи. В следующем разделе работы с помощью программы Excel проводится исследование корреляционной связи.