Смекни!
smekni.com

Статистическое изучение модификационной изменчивости. Построение вариационных рядов (стр. 1 из 3)

Статистическое изучение модификационной изменчивости.

Построение вариационных рядов

Подготовка материала к математической обработке

Предметом изучения биометрии являются варьирующие (изменяющиеся) признаки у относительно однородной группы объектов, называемой совокупностью.

Различают совокупность генеральную и выборочную, или случайную, которую называют выборка.

Генеральной совокупностью может быть любая группа особей. Изучается же, как правило, часть членов генеральной совокупности, так называемая выборочная совокупность, или выборка.

Основное требование к выборке – ее репрезентативность, т.е. достоверное отражение генеральной совокупности. Достигается это случайным отбором объектов для формирования выборки. Объем генеральной совокупности принято обозначать буквой N, а выборочной – n. Если в выборку включено меньше 30 членов (n<30), ее называют малой, во всех других случаях – большой.

По характеру изменчивости различают изменчивость качественную и количественную. Количественная изменчивость может быть дискретной, т.е. прерывистой (она выражается только целыми числами: количество детей при рождении, число сосков у многоплодных животных и т.д.), и непрерывной, когда варианты могут принимать любое значение (вес, рост, размер обуви, объем крови в организме и т. д.). Величина признака отдельной особи, т.е. числовое его значение, называется вариантой и обозначается буквой Х. Обработка варьирующих показателей начинается с их группировки. Способ группировки зависит как от характера изменчивости, так и от объема выборки.

Наиболее простым методом группировки, применяемым при любом характере изменчивости при небольших размерах выборки (n<30), является ранжирование.

Пример: вес новорожденных при рождении был равен (в кг):

3,3; 3,1; 3,2; 4,2; 3,4; 3,0; 3,8; 3,3; 3,2; 4,2.

Ранжированный ряд этой выборки будет выглядеть так:

3,0; 3,1; 3,2; 3,2; 3,3; 3,3; 3,4; 3,8; 4,2; 4,2.

Сущность ранжирования состоит в том, что варианты располагаются в строгом порядке по принципу их увеличения или уменьшения (т.е. по ранжиру). Минимальный вес новорожденных 3,0 кг, максимальный – 4,2 кг.

Для больших выборок (n>30) основным методом группировки является построение вариационного ряда.

Вариационным рядом называется двойной ряд, отражающий распределение вариант по классам.

При составлении вариационного ряда значения, которые принимает признак, называют классами (W), а количество вариант в классе – частотами (p или f). Сумма частот по всем классам должна равняться объему выборки (n). В математическом выражении это записывается так: Sp = n. Если признак имеет большой размах изменчивости, то в этом случае в один класс рекомендуется объединить варианты с несколькими, близкими между собой, значениями.

Классы вариационного ряда в таком случае не будут совпадать со значениями, которые признак может принимать в процессе изменчивости, а будут характеризоваться несколькими показателями: началом класса (Wн), т.е. минимальным значением признака, концом класса (Wк), т.е. максимальным значением признака.

Построение вариационного ряда

Разберем на конкретном примере построение вариационного ряда.

Пример. При взвешивании 50 спортсменов получены следующие данные (в кг):

58 50 53 53 50 61 58 58 57 52

49 51 63 55 50 57 66 46 60 53

58 53 50 54 50 51 67 47 52 47

47 54 59 54 53 57 52 50 46 56

42 55 52 57 54 56 50 59 49 54

Для составления вариационного ряда необходимо:

1. Найти в учетах данных максимальное (max) и минимальное (min) значения признака.

Разница между максимальным и минимальным значениями признака (варианта) – это размах изменчивости признака (lim = max–min).

2. Исходя из объема выборки и размаха изменчивости, выбрать оптимальное число классов (k) для проведения группировки.

Число наблюдений Число классов

40–60 6–10

61–100 7–10

101–200 9–12

201–500 12–17

В нашем примере число измерений равняется 50. Значит , число классов должно быть в пределах 6–10. В этих пределах подбирать число классов следует таким образом, чтобы величина классового промежутка была удобной для подсчета и, желательно, оканчивалась на цифру 5 или 0.

3. На основании выбранного количества классов и размаха изменчивости признака установить величину классового промежутка (i), т.е. величину, на которую один класс должен отличаться от другого:


max = 67; min = 42; lim = 25; k = 8 (подобранное нами число классов = 8)



Началом первого класса обычно служит варианта с минимальным значением признака, концом первого класса – величина, равная началу первого класса, увеличенному на классовый промежуток (i). Конец последнего класса завершается максимальным значением варианты. Конец предыдущего и начало следующего классов не должны совпадать. Они должны отличаться или на целое число, или на десятые или сотые доли числа, в зависимости от величины изучаемого признака. Установленные для нашего примера границы классов заносятся в табл.1.

Статистические показатели для характеристики совокупности

Среднее значение признака

Полученные при проведении обследования данные характеризуют каждую особь совокупности в отдельности. Нас же интересуют, в первую очередь, наиболее общие свойства этой совокупности. Чтобы их установить, данные обрабатывают статистически. Основная задача статистической обработки наблюдений – нахождение ряда показателей, характеризующих в обобщенном виде свойства данной совокупности.

Одним из таких показателей является средняя арифметическая, характеризующая среднее значение признака.

Средняя арифметическая

Средняя арифметическая представляет собой как бы точку равновесия вариационного ряда, отклонения от которой в сторону увеличения или уменьшения признака взаимно уравновешиваются. Средняя арифметическая показывает, какую величину признака имели бы особи данной группы, если бы эта величина была у всех одинаковой.

Простейший метод вычисления средней арифметической величины для небольшой выборки (n<30) – это простое суммирование, т.е. нахождение суммы вариант выборки и деление ее на объем выборки. Среднюю арифметическую обозначают Хср или М.


где X – величина варьирующего признака;

n – объем выборки;

S – знак суммирования.


Для больших выборок среднюю арифметическую удобнее вычислить косвенным методом по формуле:

где А – условное среднее значение нулевого класса;

р – частоты;

а – условное отклонение;

n – объем выборки;

i – величина классового промежутка.

Задание. Пользуясь вариационным рядом, представленным в таблице 1, составить таблицу 2 для вычисления средней арифметической косвенным методом.

Распределение вариант по весу Таблица 1

Границы классов (Wн – Wк) Частоты (р)
42 – 45 1
46 – 48 5
49– 51 12
52 – 54 14
55 – 57 8
58 – 60 6
61 – 63 2
64 – 67 2
Sр = n = 50

Таблица 2

Рабочая таблица для вычисления средней арифметической

методом условных отклонений

№ класса

Границы классов

(Wн – Wк)

Частоты (р) Условные отклонения (а) Произведение условных отклонений на частоты (ра)
1 42 – 45 1 –3 –3
2 46 – 48 5 –2 –10
3 49 – 51 12 –1 –12
4 52 – 54 14 0 0
5 55 – 57 8 1 8
6 58 – 60 6 2 12
7 61 – 63 2 3 6
8 64 – 67 2 4 8
Sр = n = 50 Sра = 9

Для вычисления средней арифметической необходимо:

1 Найти в построенном вариационном ряду условный средний класс. В качестве условного среднего класса рекомендуется брать класс, который занимает центральное место в данном вариационном ряду и имеет наибольшее по сравнению с другими классами значение частот (р). В нашем примере условным средним классом будет четвертый класс с наибольшей встречаемостью вариант (р = 14) и варьированием веса в пределах 52 – 54 кг.

2 Выделить условный средний класс линиями и принять за нулевой.

3 Вычислить условное среднее значение нулевого класса. Его обозначают буквой А.

В нашем примере

4


Определить условное отклонение (а) каждого класса от нулевого путем вычитания порядкового номера нулевого класса от порядкового номера других классов. Вверх от класса, принятого за условный нулевой, получим натуральный ряд отрицательных чисел (–1, –2, –3 и т.д.), вниз – натуральный ряд положительных числе (+1, +2, +3 и т.д. в зависимости от класса).

5 Найти произведение частоты на условное отклонение для каждого класса (ра) и заполнить графу.

6 Найти сумму частот (Sр = n = 50).

7 Вычислить сумму произведений частот на условное отклонение. Она равна:

Sра = –25+34 =9.

8 Вычислить среднее арифметическое по формуле:


где А – условное среднее значение нулевого класса;