Для оценки характера распределения используют следующие взаимосвязи:
1) среднее квадратическое отклонение при нормальном или умеренно деформированном распределении примерно в 1,25 раза больше линейного отклонения
2) коэффициент вариации (Variationskoeffizient, Coefficientofvariation) – это отношение среднего квадратического отклонения к средней
Здесь критическим значением выступает V = 35 %. Если V ≤ 35 %, то считаем, что наша совокупность однородна. Если V > 35 %, то совокупность разнородна и это автоматически накладывает ограничения на расчет средней (расчет просто не имеет смысла).
В нашем первом примере отношение σ/l =1,18 , т.е. распределение близко к нормальному, а V = 47 %, т.е. совокупность разнородна.
Свойства дисперсии. Правило сложения дисперсии
1) дисперсия постоянной величины равна 0
2) уменьшение всех значений признака на одну и ту же величину А не меняет дисперсии:
σ2(х - А) = σ2х
3) уменьшение всех значений признака в k раз уменьшает дисперсию в k2 раз, а среднее квадратическое отклонение – в k раз.
σ2(х / k) = σ2х : k2
σ(х / k) = σх : k
4) дисперсия равна средней из квадратов значений признака минус квадрат средней значений признака:
5)
дисперсия по средней есть величина минимальная, т.е. она всегда меньше дисперсии по любой из величин А на ( Х – А)2 : - А)26) дисперсию, в отличие от среднего квадратического отклонения, можно собирать по частям и делить на части.
Существует так называемое правило сложения дисперсии, которое заключается в следующем:
δ² - межгрупповая дисперсия;
α² - средняя из внутригрупповых.Межгрупповая дисперсия – это дисперсия, характеризующая влияние фактора, положенного в основу группировки. Ее расчет производится по следующей формуле:
Xi – средняя по каждой группе; Xобщ – общая средняя;m – количество групп.
Средняя из внутригрупповых дисперсий отражает влияние прочих факторов и определяется, как:
k – объем k-ой группы.
Исчисление среднеарифметической и показателей вариации для качественных (атрибутивных или номинально измеряемых) признаков
Наряду с вариацией количественных признаков может ставиться задача оценки вариации качественных признаков, например, при изучении качества продукции вся она делится на годную и бракованную.
В таком случае за эквивалент наличия признака (ответ "да") принимается 1, отсутствие признака обозначается 0 (ответ “нет”).
Общее число единиц совокупности примем за n, тогда число единиц совокупности, обладающих данным признаком, будет f, а число единиц, не обладающих данным признаком, будет (n - f).
Ряд распределения по качественному признаку представлен в табл. 5.2. таблице:
Таблица 5.2.
Пример ряда распределения по качественному признаку
Значение переменной | Частота |
1 | f |
0 | n-f |
Итого | n |
Тогда средняя арифметическая равна:
Фактически, это доля единиц, обладающих данным признаком. Соответственно, доля единиц, не обладающих данным признаком равна:
Так как p + q = 1, то для дисперсии альтернативного признака имеем:
На практике это означает, что дисперсия по альтернативным или качественно изменяющимся признакам подчиняется следующему правилу
Среднее квадратическое отклонение по альтернативному признаку:
Коэффициент вариации:
Пример. В результате контроля качества из 1000 готовых изделий 20 оказались бракованными. Нужно вычислить дисперсию и среднеквадратическое отклонение по данному номинально измеряемому признаку.
5.3 Свойства нормального распределения
Нормальное распределение возможно в том случае, когда на величину признака влияет большое число случайных причин, которые не зависят друг от друга и ни одна из которых не имеет преобладающего влияние над другими.
1) Кривая распределения симметрична относительно максимальной ординаты:
2) кривая нормального распределения имеет две точки перегиба х ±σ
3) В промежутках между:
5.4 Моменты
Показатели вариации характеризуют ряд с точки зрения рассеивания, колеблемости значений признака. Ряд распределения, помимо рассеивания, может быть симметричным (асимметричным), остро- и плосковершинным. Универсальными характеристиками ряда распределения являются моменты (Momente, Moments) – средняя арифметическая тех или иных степеней отклонений значений признака от определенной исходной величины А.
Их общая формула:
Если А = 0, то момент называется начальным.
Если А = х, то момент называется центральным;Если А = условной величине, то момент называется условным.
В таблице 5.3. представлены формулы моментов первых четырех порядков.
Таблица 5.3.
Начальные, центральные и условные моменты первых четырех порядков
Моменты распределения, порядка | Начальные | Центральные | Условные |
Первого | |||
Второго | |||
Третьего | |||
Четвертого |
Большое значение имеют центральные моменты, обозначаемые μi.
Центральный момент 2-го порядка – это дисперсия:
С помощью центральных моментов 3-го порядка
исчисляются показатели симметричности (асимметричности) ряда. Так, если μ3 = 0, то ряд распределения симметричен, μ3 < 0, то ряд имеет левостороннюю асимметрию, μ3 >0, то у ряда правосторонняя асимметрия (см. рис.5.3).