Диаграмма разброса позволяет без математической обработки экспериментальных данных значений двух переменных на основе их графического представления оценить характер и тесноту связи между ними. Это дает возможность линейному персоналу контролировать ход процесса, а технологам и менеджерам - управлять им. Этими двумя переменными могут быть:
а) характеристика качества процесса и фактор, влияющий на ход процесса. К примерам применения диаграммы разброса для анализа зависимости между причинным фактором и характеристикой (следствием) относятся диаграммы для анализа зависимости суммы, на которую заключены контракты, от числа поездок бизнесмена с целью заключения контрактов; процента брака от процента невыхода на работу операторов; расхода сырья на единицу готовой продукции от степени чистоты сырья; выхода реакции от температуры реакции; степени деформации от скорости формовки и т. д.
При наличии корреляционной зависимости причинный фактор оказывает очень большое влияние на характеристику, поэтому, удерживая этот фактор под контролем, можно достичь стабильности характеристики. Можно также определить уровень контроля, необходимый для требуемого показателя качества;
б) две различные характеристики качества. Примерами применения диаграммы разброса для анализа зависимости между двумя причинными факторами могут служить диаграммы для анализа зависимости между содержанием рекламаций и руководством по эксплуатации изделия; между циклами закалки отожженной стали и газовым составом атмосферы; между числом курсов обучения оператора и степенью его мастерства и т. д.
При наличии корреляционной зависимости между отдельными факторами значительно облегчается контроль процесса с технологической, временной и экономической точек зрения;
в) два фактора, влияющие на одну характеристику качества. Применение диаграммы разброса для анализа зависимости между двумя характеристиками (результатами) можно видеть на таких примерах, как анализ зависимости между объемом производства и себестоимостью изделия; между прочностью на растяжение стальной пластины и ее прочностью на изгиб; между размерами комплектующих деталей и размерами изделий, смонтированных из этих деталей; между прямыми и косвенными затратами, составляющими себестоимость изделия; между толщиной стального листа и устойчивостью к изгибам и т. д.
При наличии корреляционной зависимости можно осуществлять контроль только одной (любой) из двух характеристик.
Построение диаграммы разброса (поля корреляции) производят в следующем порядке.
- Планируют и выполняют эксперимент, при котором реализуется взаимосвязь у = f(x), либо производят сбор данных, в которых выявляется взаимосвязь у =f(x). Первый путь получения данных характерен для технических (конструкторских или технологических) задач, второй путь - для организационных и социальных задач. Желательно получить не менее 25-30 пар данных, которые заносят в таблицу. Таблица имеет три графы: номер опыта (или детали), значения x и у.
- Оценивают однородность экспериментальных данных. Резко выделяющиеся результаты, не принадлежащие данной выборке, исключают попарно.
- Находят максимальные и минимальные значения х и у. Выбирают масштабы по оси ординат (у) и оси абсцисс (х) так, чтобы изменение факторов по этим осям имело место на участках примерно одинаковой длины. Тогда диаграмму будет легче читать. На каждой оси нужно иметь от 3 до 10 градаций. Желательно использовать целые числа.
- Для каждой пары значений yi – xi на графике получают точку как пересечение соответствующих ординаты и абсциссы. Если в разных наблюдениях получены одинаковые значения вокруг точки, рисуют столько концентричных кружков, сколько этих значений минус одно, либо наносят все точки рядом, либо рядом с точкой указывают общее число одинаковых значений.
- На диаграмме или рядом с ней указывают время и условия ее построения (общее число наблюдений, фамилию и инициалы оператора, собравшего данные, средства измерений, цену деления каждого из них и др.).
- Для построения эмпирической линии регрессии диапазон изменения х (или у) разбирают на 3-5 равных частей. Внутри каждой зоны для попавших в нее точек находят значения
и (j – номер зоны). Наносят эти точки на диаграмму (на рисунке 7 они обозначены треугольниками) и соединяют между собой. Полученная ломаная более наглядно иллюстрирует вид зависимости у=f(х).Эмпирическую линию регрессии строят обычно на этапе обработки опытных данных, но даже само расположение точек диаграммы рассеяния в факторном пространстве (у – х) без построения этой линии позволяет предварительно оценить вид и тесноту взаимосвязи у=f(x).
F – погрешность направления зубьев,
ET – биение опорного торца заготовки
Рисунок 7 – Диаграмма разброса F=f(ET) при зубофрезеровании
цилиндрических шестерен
Взаимосвязь двух факторов может быть линейной или нелинейной, прямой или обратной, тесной или слабой (легкой) (рисунок 8).
После качественного анализа зависимости у=f(x) по форме и расположению диаграммы рассеяния выполняют количественный анализ этой зависимости. При этом часто используют такие методы, как метод медиан, метод сравнения графиков изменения значений у и х во времени или контрольных карт для этих значений, методы корреляционно-регрессионного анализа.
Наиболее объективную, количественную оценку степени тесноты и характера взаимосвязи между значениями изучаемых параметров можно получить при использовании методов корреляционно-регрес-сионного анализа. Достоинством этих методов является также то, что достоверность их результатов поддается оценке.
Степень тесноты линейной взаимосвязи между двумя факторами оценивается с помощью коэффициента парной корреляции:
(2) |
где
– средние арифметические значения уi и хi в данной выборке, i – номер опыта, Sy, Sx – их средние квадратические (стандартные) отклонения, n – объем выборки (часто n составляет от 30 до 100).Рисунок 8 – Различные типы корреляции
Достоверность ryx оценивается обычно с помощью критерия Стьюдента. Значения ryx находятся в интервале от минус 1 до +1. Если они достоверны, то есть существенно отличаются от 0, значит, между исследуемыми факторами имеется линейная корреляционная зависимость. В противном случае эта зависимость отсутствует либо является существенно нелинейной. Если значение ryx равно +1 или минус 1, что встречается крайне редко, между исследуемыми факторами существует функциональная взаимосвязь. Знак ryx говорит о прямом (+) или обратном (-) характере взаимосвязи между исследуемыми факторами.
При наличии достоверной взаимосвязи величин у и х находят ее математическое описание (модель). Для этого проводят регрессионный анализ, который сводится к оценке параметров регрессии β0 и β1, проверке гипотезы о значимости модели и оценке ее адекватности. При этом часто используют полиномы различной степени.
Для оценки параметров регрессии используется метод наименьших квадратов. Прогнозируемое значение зависимой переменной при линейной регрессии определяется как:
(3) |
Для оценки параметров модели используют зависимости:
, | (4) |
где
(5) |
Значимость уравнения регрессии обычно оценивается с помощью F-критерия Фишера. Разности между наблюдаемыми и прогнозируемыми значениями называют остатками, а соответствующую сумму квадратов – остаточной суммой квадратов:
(6) |
Для проверки значимости определяют значение F и сравнивают с распределением Фишера при заданном уровне значимости α и числами степеней свободы 1 и (n-2). Если F> F1-α (1, n-2), то регрессионная модель статистически значима.