Смекни!
smekni.com

Статистическая обработка и статистический анализ данных по материалам статистического наблюдения (стр. 2 из 4)

Медина равна 21,91%. То есть половина единиц совокупности имеет значение показателя ниже данного, а вторая половина – не меньше медианного. Мода же равна 22,8%. Данная характеристика указывает на наиболее часто встречающееся значение признака. Однако, поскольку ряд интервальный, следует рассматривать моду как значение, вокруг которого плотность распределения достигает своего пика. То есть вокруг этого значения сконцентрировано наибольшее количество регионов РФ.

Для нормального закона характерно следующее соотношение: медиана находится в интервале между модой и средним значением, при чем она ближе к средней, чем к моде. В рассматриваемой совокупности имеет место иное соотношение, а именно: Xср>Me>Mo, что обусловлено выраженной правосторонней асимметрии. Таким образом, нельзя утверждать, что распределение подчиняется вышеуказанному закону.

Характеристики рассеяния

Простейшим из показателей данной группы является вариационный размах. Он равен 70,4%, что является достаточно большим значением. Но он дает лишь самое общее представление о размерах вариации, так как показывает, насколько отчаются друг от друга крайние значения, но не указывают, насколько велики отклонения значений признака друг от друга внутри этого промежутка.

Более точным будет такой показатель, который учитывает отклонение каждой из вариант от средней величины. Среднее линейное отклонение составило 10,86%. Именно на это значение отклоняется в среднем доля доходов, идущих на пополнение финансовых активов, от своего среднего значения. Также необходимо рассчитать среднее квадратическое отклонение. Оно равно 14,23%. По свойству мажорантности средних среднее квадратическое отклонение всегда больше среднего линейного отклонения. Соотношение среднего квадратического отклонения и среднего линейного отклонения, равное 1,31, позволяет сделать вывод об отсутствии нормального распределения.

Дисперсия – это средний квадрат отклонений индивидуальных значений признака от их средней величины. В нашем случае она равна 202,49%.

К относительным показателям вариации относят: относительный размах вариации (2,6), относительное линейное отклонение (0,4) и коэффициент вариации (0,53). Коэффициент вариации отражает состояние между вариацией выборки и ее центром. Данное значение коэффициента свидетельствует о том, что степень концентрации вокруг среднего допустима.

Относительное линейное отклонение показывает, что доля усредненного значения абсолютных отклонений от средней величины составляет 40%.

Относительный размах вариации отражает относительную колеблемость крайних значений признака вокруг средней. Такое значение коэффициента говорит о том, что относительный разброс значений признака достаточно высок.

Характеристики формы распределения вариационного ряда

Сюда относятся коэффициент асимметрии и коэффициент эксцесса.

Коэффициент асимметрии рассчитывается с помощью моментов третьего порядка. Для данной совокупности он равен 1,04. Такое значение показывает, что имеет место выраженная правосторонняя асимметрия и большинство значений признака имеет значение ниже среднего.

Так как коэффициент асимметрии не равен нулю, то не имеет смысла рассчитывать показатель эксцесса. Все вышеперечисленное подтверждает гипотезу об отсутствии нормального распределения.

Моделирование ряда распределения

Нормальное распределение важно по многим причинам. Распределение многих статистик является нормальным или может быть получено из нормальных с помощью некоторых преобразований. Рассуждая философски, можно сказать, что нормальное распределение представляет собой одну из эмпирически проверенных истин относительно общей природы действительности и его положение может рассматриваться как один из фундаментальных законов природы.

Выдвинем гипотезу о том, что распределение в совокупности подчиняется нормальному закону. Воспользуемся для проверки гипотезы критерием согласия Пирсона, для чего возьмем за основу вариационный ряд, составленный ранее. Для расчетов понадобятся значения средней величины (27,1), среднего квадратического отклонения (14,23) и длина интервала (9). Дополним ряд так, чтобы получилась следующая таблица:

X`j Интервал
t
4,5 0 9 5 -1,59 0,1127 6 0,1667
13,5 9 18 16 -0,96 0,2516 14 0,2857
22,5 18 27 32 -0,32 0,3790 21 5,7619
31,5 27 36 18 0,31 0,3802 21 0,4286
40,5 36 45 8 0,94 0,2565 14 2,5714
49,5 45 54 2 1,57 0,1163 6 2,6667
58,5 54 63 4 2,21 0,0347 2 2,0000
67,5 63 72 3 2,84 0,0071 0 ошибка деления на ноль

Таблица 4 –Моделирование ряла распределения

Видно, что для последнего интервала округленная теоретическая частота, то есть частота, которая должна быть при нормальном распределении, статистически незначима. Для интервала 54-63 теоретическая частота равна 2, что тоже достаточно невысокий показатель. Объединим последние три интервала в один. Получим интервал 45-72 с длиной, равной 27. Необходимо также пересчитать среднее значение и среднее квадратическое отклонение. Они равны соответственно 27 и 13,84.

X`j Интервал
t
4,5 0 9 5 -1,63 0,1057 6 0,1667
13,5 9 18 16 -0,98 0,2468 14 0,2857
22,5 18 27 32 -0,33 0,3778 22 4,5455
31,5 27 36 18 0,33 0,3778 22 0,7273
40,5 36 45 8 0,98 0,2468 14 2,5714
58,5 45 72 9 2,28 0,0297 5 3,2
Итого Х Х Х Х Х Х 11,4965

Таблица 5 – моделирование ряда распределения после объединения интервалов


В данном ряду нет статистически незначимых частот, поэтому можно приступать к определению χ2. Предельное значение, определяющее условия отклонения гипотезы о нормальном характере распределения, для уровня значимости=0,05 при степени свободы=3 равно 7,815. Эмпирическое же значение равно 11,5. Так как теоретическое значение меньше полученного на практике, то гипотеза о нормальном законе распределения отвергается. Имеет место выраженная правосторонняя асимметрия со смещением в область более низких значений.

Оценка параметров генеральной совокупности на основе выборочных данных

В реальных условиях для наблюдения какого-то признака практически никогда не анализируется вся совокупность в целом. Вместо этого применяют выборочное наблюдение, то есть статистическому обследованию подвергаются определенным образом отобранные единицы изучаемой совокупности. Целью выборочного наблюдения является характеристика всей совокупности единиц по обследуемой части, при условии соблюдения всех правил и принципов статистического наблюдения. Это позволяет сэкономить материальные, трудовые ресурсы, время, дает возможность более детально и подробно изучить отдельные единицы статистической совокупности и их группы.

Для проведения выборочного наблюдения необходимо определить способ отбора и тип выборки. В данном конкретном случае считаю оптимальным применение бесповторной собственно случайной выборки методом жеребьевки, так как единицы наблюдаемой совокупности не упорядочены и с равной вероятностью могут попасть в выборку.

Выборка 54 регионов

Из 88 регионов выберем 54. Выбранные единицы представлены в Приложении В.

Рассчитаем выборочную среднюю для совокупности. Вследствие отсутствия весов рассчитывается как простая арифметическая средняя. Она равна 27,07%. Вычислим предельную ошибку средней с помощью коэффициента доверия для вероятностей 0,760, 0,860, 0,880 и 0,960.

Вероятность Предельная ошибка
0,76 6,05
0,86 6,68
0,88 6,80
0,96 7,25

Таблица 6 – Предельные ошибки

Необходимо отметить, что используемая для расчета предельной ошибки средней дисперсия генеральной совокупности вычисляется из выборочной дисперсии путем ее умножения на величину n/(n-1), где n – размер выборочной совокупности. В нашем случае этот коэффициент равен 54/53.

В результате получаем следующие доверительные интервалы генеральной средней:

Таблица 7 – Доверительные интервалы генеральной средней

Вероятность Интервал
0,76 21,02 - 33,12
0,86 20,39 - 33,75
0,88 20,27 - 33,86
0,96 19,81 - 34,32

Выборка 24 региона

Выберем 24 региона из совокупности (Приложение Г). Рассчитаем среднее значение выборки как среднюю арифметическую величину. Оно равно 29,14%.

Так как количество единиц в выборке меньше 30, то она относится к малым. Следовательно, расчет предельной средней необходимо проводить по правилам малой выборки.

Здесь используется критерий доверия Стьюдента. Также необходимо отметить, что применяется выборочная, а не генеральная дисперсия, и коэффициент корректировки на бесповторность. Получаем следующие предельные ошибки:

Степень значимости Предельная ошибка
0,24 3,43
0,14 4,45
0,12 4,45
0,04 6,49

Таблица 8 – предельные ошибки малой выборки

Коэффициент корректировки на бесповторность равен 64/87. Число степеней свободы равно 23. Значение коэффициента доверия Стьюдента выбирается по соответствующей таблице.