Смекни!
smekni.com

Методические рекомендации по организации самостоятельной работы студентов заочного отделения. (стр. 13 из 46)

Проследить зависимость между факторами можно также на основе комбинационной группировки. Комбинационная группировка осуществля­ется одновременно по двум и более признакам, взятым в сочетании.

Макет комбинационной таблицы выглядит следующим образом:

Наименование таблицы

Группировка по признаку-фактору

Группировка по признаку-результату

Всего

n11

n12

n1M

Σ nij

n21

N22

n2M

Σ n2j

nK1

nk2

NKM

Σ nMj

Всего

Σ ni1

Σ ni2

Σ niK

Σ nij

Здесь nij - частота совместного появления значения i признака-фактора (i = 1,2,… , М) и значения j признака результата (j= 1,2, …, K).

Если наибольшие частоты каждой строки и каждого столбца распо­лагаются вдоль диагонали таблицы, идущей от левого верхнего угла таб­лицы к правому нижнему, то можно сделать вывод, что связь между при­знаками является прямой и близкой к линейной.

Если наибольшие частоты располагаются вдоль диагонали от право­го верхнего угла к нижнему левому, то связь — обратная и близкая к ли­нейной.

Если частоты во всех клетках таблицы примерно одинаковы, то свя­зи между признаками нет.

Задание №2

1. На основе равноинтервальной структурной группировки (для лю­бого признака) построить вариационный частотный и кумулятивный ряды распределения, оформить в таблице, изобразить графически.

2. Проанализировать вариационный ряд распределения, вычислив:

· среднее арифметическое значение признака;

· медиану и моду, квартили и децили распределения;

· среднее квадратичное отклонение;

· коэффициент вариации.

3. Проверить теорему о разложении дисперсии, используя данные
аналитической группировки.

4. Сделать выводы.

Обобщающие характеристики совокупностей

Анализ статистических совокупностей включает в себя: построение рядов распределения; графическое представление распределения; опреде­ление характеристик центра распределения, показателей вариации.

Рядами распределения называют числовые ряды, характеризующие структуру совокупности по некоторому признаку. Ряд распределения мо­жет быть получен в результате структурной группировки. Ряд распределе­ния, образованный по количественному признаку (он называется вариаци­онным радом), может быть дискретным, если значения признака выражены целыми числами и каждая варианта представлена в вариационном ряде от­дельной группой, или интервальным (непрерывным), если значения при­знака выражены вещественными числами или число вариант признака дос­таточно велико.

Ряд распределения состоит из следующих элементов:

xi - варианта- отдельное, возможное значение признака i=1,2,...,К, где К - число значений признака;

Ni - частоты - численность отдельных групп соответствующих зна­чений признаков;

N - объём совокупности - общее число элементов совокупности;

qi - частость - доля отдельных групп во всей совокупности;

Di - величина интервала.

Если вариационный ряд представлен неравными интервалами, то рассчитывается абсолютная и относительная плотности распределения.

Абсолютная плотность h - это отношение частоты к величине интер­вала, а относительная плотность

- это отношение частости к величине интервала:

hi=Ni /Di,

= qi /Di.

Полученный вариационный ряд оформляется в виде таблицы, где в первой графе указываются варианты (интервалы) значений признака, а в следующих графах - частота, частость или, если необходимо, абсолютная или относительная плотность распределения.

Ряд распределения по частоте (частости) в целом характеризует структуру совокупности по данному признаку. Однако для описания рас­пределения совокупность могут использоваться и кумулятивные ряды, т.е. ряды накопленных частот (или частостей), которые иногда имеют даже не­которые преимущества.

Накопленная частота (частость) данного значения признака - это число (доля) элементов совокупности, индивидуальные значения признака которых не превышают данного.

Обозначим: F(x) - накопленная частота для данного значения х; G(x) - накопленная частость для данного значения х.

Эти характеристики обладают следующими свойствами:

Рассмотрим интервалы

:

.

Первым этапом изучения вариационного ряда является его графиче­ское изображение. Способы построения графиков для разных видов рядов распределения различны.

Изображением дискретного ряда распределения является полигон. В системе координат по оси абсцисс откладываются варианты

, по оси ор­динат - частоты (частости), затем отмечают точки с координатами (
), которые последовательно соединяются отрезками прямой.

Интервальный ряд распределения изображается графически в виде гистограммы. При ее построении на оси абсцисс откладывают интервалы ряда. Над осью абсцисс строятся прямоугольники, основанием которых является интервал, а высота - соответствующая этому интервалу плотность распределения (или частота, частость - если ряд равноинтервальный).

Изображением ряда накопленных частот служит кумулята. Накоп­ленные частоты наносятся в системе координат в виде ординат для границ интервалов; соединяя нанесенные точки отрезками прямых, получаем кумуляту.

Вторым этапом изучения вариационного ряда является определение характеристик центра распределения. Характеристика центра распределе­ния представляет собой такую величину, которая в некотором отношении характерна для данного распределения и является его центральной вели­чиной.

К характеристикам центра распределения относятся: средняя ариф­метическая, медиана, мода.

Для сгруппированных данных, представленных в вариационном ряду, средняя арифметическая (

) определяется как:

,

т.е. в качестве веса при усреднении берётся частота Ni , соответст­вующая групповым значениям xi. Если ряд дискретный, то каждое значе­ние признака представлено. Если же ряд интервальный, то его нужно пре­вратить в условно дискретный: в качестве группового значения xi для каж­дого интервала вычисляется его середина.

Медиана (Ме[x]) - это такое значение признака, которое делит объём совокупности пополам в том смысле, что число элементов совокупности с индивидуальными значениями признака, меньшими медианы, равна числу элементов совокупности с индивидуальными значениями больше медианы.

Численное значение медианы можно определить по ряду накоплен­ных частот. Накопленная частота для Ме[х] равна половине объёма сово­купности (F(Me[x]) = N/2); имея ряд накопленных частот, можно вычис­лить, при каком значении признака накопленная частота равна половине объёма совокупности. Для интервального ряда в этом случае определяется только интервал, в котором будет находиться Ме[x], само значение при­ближённо можно определить как:

,

где

- начало интервала, содержащего медиану;

- величина интервала, содержащего медиану;

- накопленная частота на начало интервала, содержащего ме­диану;

N - объём совокупности;

- частота того интервала, в котором расположена медиана.

Квартили (Q1, Q2, Q3) - значения признака, делящие упорядоченную по значению признака совокупность на 4 равные части. 1-ая квартиль (Q1) определяет такое значение признака, что ¼ единиц совокупности имеют значения признака меньше, чем Q1, а ¾ - значения больше чем Q1. 2-ая квартиль (Q2) равна медиане. 3-я квартиль (Q3) определяет такое значение признака, что ¾ единиц совокупности имеют значения признака меньше, чем Q3, а ¼ - больше чем Q3. Значения квартилей для сгруппированных данных определяются по накопленным частотам. При этом для 1-ой квар­тили накопленная частота сравнивается с величиной N·1/4; для 3-ей квартили - с величиной N·3/4. Значение квартили для интервального ряда распределения может быть уточнено по формуле: