при этом справедливы соотношения:
p00 + p10 + p01 + p11 = 1, p10 + p11 = p1 , p01 + p11 = p2 .
С прикладной точки зрения наиболее интересна вероятность p00 того, что единица продукции является годной (по всем параметрам), и вероятность ее дефектности (1-p00 ), т.е. входной уровень дефектности для изделия в целом.
В табл.1 сведены вместе введенные выше вероятности.
Табл. 1. Вероятности результаты испытаний
при контроле по двум альтернативным признакам
X=0 | X=1 | Всего | |
Y=0 | |||
Y=1 | |||
Всего | 1 |
Есть три важных частных случая - поглощения, несовместности и независимости дефектов, другими словами, поглощения, несовместности и независимости событий {w: X(w) = 1} и {w: Y(w) = 1}. В случае поглощения одно из этих событий содержит другое, а потому
p00 = 1 - max ( p1 , p2 ) .
В случае несовместности
p00 = 1 - p1 - p2 .
В случае независимости
p00 = (1 - p1 )(1 - p2) = 1 - p1 - p2 + p1p2 .
Ояевидно, что вероятность годности изделия всегда заключена между значениями, соответствующими случаям поглощения и несовместности. Кроме того, известно, что при большом числе признаков и малой вероятности дефектности по каждому из них случаи поглощения и независимости дают (в асимптотике) крайние значения для вероятности годности изделия, т.е. формулы, соответствующие независимости и несовместности, асимптотически совпадают.
Рассмотрим несколько примеров. Пусть некоторая продукция, скажем, гвозди, контролируются по двум альтернативным признакам, для определенности, по весу и длине. Пусть результаты контроля 1000 единиц продукции представлены в табл.2
Табл. 2. Результаты 1000 испытаний
по двум альтернативным признакам (случай поглощения)
Х=0 | Х=1 | Всего | |
У=0 | 952 | 0 | 952 |
У=1 | 0 | 48 | 48 |
Всего | 952 | 48 | 1000 |
Судя по данным табл.2, дефекты всегда встречаются парами - если есть один, то есть и другой. Входной уровень дефектности как по каждому показателю, так и по обоим вместе - один и тот же, а именно, 0,048. Получив по результатам статистического наблюдения данные типа приведенных в табл.2, целесообразно перейти к контролю только одного показателя, а не двух. Каково именно? Видимо, того, контроль которого дешевле. Однако совсем иная ситуация в случае несовместности дефектов (табл.3).
Табл. 3.
Результаты 1000 испытаний
по двум альтернативным признакам (случай несовместности )
Х=0 | Х=1 | Всего | |
У=0 | 904 | 48 | 952 |
У=1 | 48 | 0 | 48 |
Всего | 952 | 48 | 1000 |
Судя по данным табл.3, дефекты всегда встречаются поодиночке - если есть один, то другого нет. В результате входной уровень дефектности по каждому признаку по-прежнему равен 0,048, в то время как доля дефектных изделий (т.е. имеющих хотя бы один дефект) вдвое выше, т.е. входной уровень дефектности для изделия в целом равен 0,096.
Случай независимости результатов контроля по двум независимым признакам (табл.4) лежит между крайними случаями поглощения и несовместности. Независимость альтернативных признаков обосновывается путем статистической проверки с помощью описанного ниже критерия n1/2V, значение которого для данных табл.4 равно 1,866.
Табл. 4.
Результаты 1000 испытаний
по двум альтернативным признакам (случай независимости)
Х=0 | Х=1 | Всего | |
У=0 | 909 | 43 | 952 |
У=1 | 43 | 5 | 48 |
Всего | 952 | 48 | 1000 |
Согласно данным табл.4, входной уровень дефектности для каждого из двух альтернативных признаков по-прежнему равен 0,048, в то время как для изделий в целом он равен 0,091, т.е. на 5,5% меньше, чем в случае несовместности, и на 47% больше, чем в случае поглощения.
Проблема состоит в том, что таблицы и стандарты по статистическому приемочному контролю относятся обычно к случаю одного контролируемого параметра. А как быть, если контролируемых параметров несколько? Приведенные выше примеры показывают, что входной уровень дефектности изделия в целом не определяется однозначно по входным уровням дефектности отдельных его параметров.
Как должны соотноситься характеристики планов контроля по отдельным признакам с характеристиками плана контроля по двум (или многим) признакам одновременно? Рассмотрим распространенную рекомендацию - складывать уровни дефектности, т.е. считать, что уровень дефектности изделия в целом равен сумме уровней дефектности по отдельным его параметрам. Она, очевидно, опирается на гипотезу несовместности дефектов, а потому во многих случаях преувеличивает дефектность, а потому ведет к использованию излишне жестких планов контроля, что экономически невыгодно.
Зная специфику применяемых технологических процессов, в ряде конкретных случаев можно предположить, что дефекты по различным признакам возникают независимо друг от друга. Это предположение необходимо обосновывать по статистическим данным. Если же оно обосновано, следует рассчитывать входной уровень дефектности по формуле
1 - p00 = p1 + p2 - p1p2 ,
соответствующей независимости признаков.
Итак, необходимо уметь проверять по статистическим данным гипотезу независимости двух альтернативных признаков. Речь идет о статистической проверке нулевой гипотезы
Н0: p11 = p1 p2 (22)
(что эквивалентно проверке равенства p00 = (1 - p1)(1 - p2)). Нетрудно проверить, что гипотеза о справедливости равенства (22) эквивалентна гипотезе
Н0 : p00 p11 - p10 p01 = 0. (23)
В простейшем случае предполагается, что проведено n независимых испытаний (Xi , Yi), i = 1,2,...,n, в каждом из которых проконтролированы два альтернативных признака, а вероятности результатов контроля не меняются от испытания к испытанию. Общий вид статистических данных приведен в табл.5.
Табл. 5.
Общий вид результатов контроля
по двум альтернативным признакам.
Х=0 | Х=1 | Всего | |
У=0 | a | b | a+b |
У=1 | c | d | c+d |
Всего | a+c | b+d | n |
В табл.5 величина a - число испытаний, в которых (Xi , Yi) = (0,0), величина b - число испытаний, в которых (Xi , Yi) = (1,0), и т.д.
Случайный вектор (a, b, c, d) имеет мультиномиальное распределение с числом испытаний n и вектором вероятностей исходов (p00 , p10 , p01 , p11 ). Состоятельными оценками этих вероятностей являются дроби a/n, b/n, c/n, d/n соответственно. Следовательно, критерий проверки гипотезы (23) может быть основан на статистике
Z = ad - bc . (24)
Как вытекает из известной формулы для ковариаций мультиномиального вектора (см., например, формулу (6.3.5) в учебнике С.Уилкса [14] на с. 153),
М(Z) = n (p10 p01 - p00 p11), (25)
что равно 0 при справедливости гипотезы независимости (23).
Связь между переменными X и Y обычно измеряется коэффициентом, отличающимся от Z нормирующим множителем:
V = (ad - bc) { (a + b)(a + c)(b + d)(c + d) } - 1/2(26)
(см. классическую монографию М. Дж. Кендалла и А. Стьюарта [15, с.723], на которую уже были ссылки, в частности, в главе 5). При справедливости гипотезы Н0 и больших n случайная величина nV2 имеет хи-квадрат распределение с одной степенью свободы, а n1/2V имеет стандартное нормальное распределение с математическим ожиданием 0 и дисперсией 1 (см. [15, с.736]).
Рассмотрим еще один пример. Пусть проведено 100 испытаний, результаты которых описаны в табл.6. Тогда
V = (50 . 20 - 10 . 20) (60 . 70 . 30 . 40)-1/2 =
= (1000 - 200) . 5940000-1/2 = 800 / 2245 = 0,35635,
n1/2V = 3,5635 .
Табл. 6.
Результаты 100 испытаний
по двум альтернативным признакам.
Х=0 | Х=1 | Всего | |
У=0 | 50 | 10 | 60 |
У=1 | 20 | 20 | 40 |
Всего | 70 | 30 | 100 |
Поскольку полученное значение n1/2V превышает критическое значение при любом применяемом в статистике уровне значимости, то гипотезу о независимости признаков необходимо отклонить.
К сожалению, приведенный простой метод годится не всегда. При статистическом анализе реальных данных возникают проблемы, связанные с отсутствием достаточно больших однородных выборок, т.е. выборок, в которых постоянны параметры вероятностных распределений. Реально единицы продукции представляются на контроль партиями, из каждой партии контролируются лишь несколько изделий, т.е. малая выборка. При этом от партии к партии меняются параметры p00, p10, p01, p11, описывающие уровень дефектности. Поэтому необходимы статистические методы, позволяющие проверять гипотезу независимости признаков по совокупности малых выборок. Построим один из возможных методов.