Задача 2. Постройте ряд распределения студентов по успеваемости: 2, 3, 3, 4, 2, 5, 5, 3, 3, 4, 5, 4, 5, 5, 5, 4, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 4, 4, 4. Подсчитайте локальные и накопительные частоты. Постройте полигон и кумуляту распределения. Определите моду, медиану, среднюю, дисперсию, среднее квадратическое отклонение, коэффициент вариации.
Решение:
Ряд распределения – это ряд чисел, в котором значение изучаемого признака (варианты), расположены в определенном порядке: либо в порядке возрастания, либо убывания. Наряду с вариантами ряд распределения включает и частоты – величины, показывающие сколько раз каждая варианта встречается в данной совокупности. Сумма частот равна объему совокупности. Таким образом, ряд распределения состоит из вариант (х) и частот (f)
В зависимости от прерывности или непрерывности варьирующего признака ряды распределения удобно представлять в виде двух разновидностей: дискретного и вариационного (интервального). Дискретный ряд представляет собой ряд прерывных чисел. Например, распределение студентов по успеваемости (табл. 1). При непрерывной вариации распределение признака называется интервальным. Частоты относятся ко всему интервалу.
В зависимости от вида ряда распределения по-разному можно изобразить их графически. Если ряд дискретный – строится полигон распределения. Величина признака откладывается на оси абсцисс, частоты – на оси ординат. Вершины ординат соединяются прямыми линиями. Гистограмма распределения отличается от полигона тем, что на оси абсцисс берутся не точки, а отрезки, изображающие интервал, т.е. гистограмма, строится на
Оценка (балл) | Число студентов (частоты) | Накопленные |
2 | 2 | 2 |
3 | 8 | 10 |
4 | 12 | 22 |
5 | 8 | 30 |
Итого | 30 |
В основе вариационного (интервального) ряда. По накопленным частотам строится кумулятивная кривая (кумулята).
Для определения средней арифметической надо сложить все варианты и полученную сумму разделить на число единиц, входящих в совокупность (объем совокупности). Средняя арифметическая бывает простая и взвешенная. Простая средняя используется тогда, когда каждая варианта встречается лишь один раз (1). Если каждая варианта встречается несколько раз, то следует подсчитать частоты и умножить (взвесить) каждую варианту на соответствующую частоту (2).
Простая средняя арифметическая х = (1)
Средняя арифметическая взвешенная х = (2)
Средний процент влажности найдём по формуле средней арифметической взвешенной:
= =При расчете средней арифметической для интервального ряда нужно сначала определить середины интервалов как полусуммы значений верхней и нижней границ интервала. При наличии интервалов, где <хоткрыты» верхняя или нижняя граница, величину интервала определяют по последующему или предыдущему интервалу.
Для характеристики рядов распределения кроме средней степенной применяются структурные средние: мода и медиана.
Мода – варианта, которая наиболее часто встречается в данной совокупности, т.е. варианта с наибольшей частотой. Мо=4
Медиана – варианта, находящаяся в середине ряда распределения.
Мода для дискретного ряда определяется просто и соответствует варианте с наибольшей частотой.
Медиану для дискретного определяют по накопленным частотам делением объема совокупности пополам: по таблице 1 – 30:2=15. Это соответствует медиане, равной 4.
Размах вариации – разность между наибольшей и наименьшей вариантой:
R=
=5–2=3Среднее квадратическое отклонение – показатель вариации, измеряющий величину, на которую все варианты в среднем отклоняются от средней арифметической.
Квадрат среднего квадратического отклонения называется дисперсией, или средним квадратом отклонений.
Найдем дисперсию:
s2=
=s=
=0,885 – среднее квадратическое отклонение.Наряду с абсолютным показателем колеблемости признака – средним квадратическим отклонением – широко применяется и относительный показатель – коэффициент вариации, который показывает меру колеблемости признака относительно его среднего значения и измеряется в процентах.
V=
Задача 12. Используя данные задачи 2, проверьте при уровне значимости 0,05 гипотезу о нормальном законе распределения студентов по успеваемости.
Решение:
Применяем критерий согласия – Пирсона.
Каждому ряду распределения достаточно большой совокупности объективно свойственна определенная закономерность. Моделирование кривой распределения позволяет в компактной форме дать характеристику закономерности распределения, используя ее в планировании и прогнозировании. Одним из наиболее распространенных законов распределения, применяемых в качестве стандарта, с которым сравнивают другие распределения и которое имеет важное значение для решения задач выборочного наблюдения является нормальное распределение. для того чтобы установить, верно, ли предположение о том, что эмпирическое распределение подчиняется закону нормального распределения, необходимо сравнить его с теоретическим распределением. Важно определить, являются ли различия между ними результатом действия случайных причин или обусловлены неправильно подобранной функцией.
Критерий X-Пирсона:
Значение Х 2факрi, рассчитывается по изложенной выше формуле, для которой предварительно определяются теоретические частоты.
Нормированное отклонение определяется по формуле:
Таблица – Эмпирическое и теоретическое распределение студентов по успеваемости
Оценка балл | Число студентов | t | F(t) | fm | |
2 | 2 | 2,1 | 0,0880 | 3 | 0,3 |
3 | 8 | 0,98 | 0,2017 | 7 | 0,14 |
4 | 12 | 0,15 | 0,3212 | 11 | 0,09 |
5 | 8 | 1,28 | 0,2617 | 9 | 0,11 |
Итого | 30 | х | Х | 30 | 0,64 |
Х 2 табл 8,95 при уровне значимости 0,05 и числе степеней свободы число интервалов – 1.
Так как Х 2 факт < Х 2 табл критического (допустимого) значения, то эмпирическое распределение соответствует нормальному.
Задача 27. На основании данных таблицы б (с 1 по 26 предприятие) о выпуске продукции и размере прибыли постройте аналитическую группировку, а также исследуйте наличие и характер взаимосвязи между ними. Рассчитайте коэффициент корреляции, детерминации. Сделайте выводы.
Таблица 6– Исходные данные деятельности предприятий, млн. руб.
№ предприятия | – Выпуск продукции, | Среднегодовая стоимость ОПФ, | Численность работающих, чел. | Потери рабочего времени, тыс. чел. дн. | Прибыль. | |||
1 | 65,0 | 54,6 | 340 | 66,0 | 15,7 | |||
2 | 78,0 | 73,6 | 700 | 44,0 | 18,0 | |||
3 | 41,0 | 42,0 | 100 | 91,0 | 12,1 | |||
4 | 54,0 | 46,0 | 280 | 78,0 | 13,8 | |||
5 | 66,0 | 62,0 | 410 | 57,4 | 15,5 | |||
6 | 80,0 | 68,4 | 650 | 42,0 | 17.9 | |||
7 | 45,0 | 36,0 | 170 | 100,0 | 12,8 | |||
8 | 57,0 | 49,6 | 260 | 79,8 | 14,2 | |||
9 | 67,0 | 62,4 | 380 | 57,0 | 15,9 | |||
10 | 81,0 | 71,2 | 680 | 38,0 | 17,6 | |||
11 | 92,0 | 78,8 | 800 | 23,1 | 18,2 | |||
12 | 48,0 | 51,0 | 210 | 112,0 | 13,0 | |||
13 | 59,0 | 60,8 | 230 | 72,0 | 16,5 | |||
14 | 680 | 69,0 | 400 | 55,7 | 16,2 | |||
15 | 83,0 | 70,4 | 710 | 36,0 | 16,7 | |||
16 | 52,0 | 50,0 | 340 | 85,2 | 14,6 | |||
17 | 62,0 | 55,0 | 290 | 72,8 | 14,8 | |||
18 | 69,0 | 58,4 | 520 | 54,6 | 16,1 | |||
19 | 850 | 83,2 | 720 | 37,0 | 16,7 | |||
20 | 70,0 | 75,2 | 420 | 56,4 | 15,8 | |||
21 | 71,0 | 67,2 | 420 | 56,0 | 16,4 | |||
22 | 64,0 | 64,2 | 400 | 70,4 | 15,0 | |||
23 | 72,0 | 65,0 | 430 | 53,6 | 16,5 | |||
24 | 88,0 | 76,2 | 790 | 34,9 | 18,5 | |||
25 | 73,0 | 68,0 | 560 | 55,4 | 16,4 | |||
26 | 740 | 65,6 | 550 | 52,0 | 16,0 | |||
27 28 | 96,0 | 87,2 | 810 | 20,4 | 19,1 | |||
75,0 | 71,8 | 570 | 53,1 | 16,3 | ||||
29 | 101,0 | 96,0 | 820 | 12,0 | 19,6 | |||
30 | 76,0 | 69,2 | 600 | 46,0 | 17,2 |
Решение: