Смекни!
smekni.com

Теория случайных чисел (стр. 11 из 11)

Подставив вместо Y и

их значения для случая линейной зависимости:

=

(х)=а0 + а1х

=

Заменим а1 ее значением, полученным из решения нормальных уравнений:

Коэфициент корреляции является частным случаем теоретического корреляционного соотношения

, когда связь между СВ является линейной. В этом случае r является показателем тесноты связи.

- выборочный корреляционный момент

Выборочный коэфициент корреляции обладает свойствами:

1. r=0, если св Х и Y независимы

2.

- Для любых св Х и Y

3.

- Для случая линейной зависимости св Х и Y.

Коэфициент корреляции используется для оценки тесноты связи и в случае нелинейной зависимости между случайными величинами.

Если предварительный графический анализ поля корреляции указывает на какую либо тесноту связи, полезно вычислить коэфициент корреляции.

Если модуль коэфициента корреляции

, то независимо от вида связи можно считать, что она достаточно тесна, чтобы исследоват ее форму.

Двумерное нормальное распределение.

Его возникновение объясняется центральной предельной теоремой Ляпунова:

r – коэффициент корреляции. Х и У по отдельности распределены нормально (mx,sx) и (my,sy).

В частном случае независимых СВ Х и У r=0:

Исходные плотности одномерных нормальных распределений Х и У:

Условное распределение – нормальное с условиями:

и
.

Первое условие является уравнением функции регрессии.

и
.

Нормальная регрессия прямолинейна. Точность оценки у/х одинакова для всех х. В качестве меры тесноты связи используется коэффициент корреляции, а форму связи при этом характеризует коэффициент регрессии.

Z=fxy(x,y) – трехмерная поверхность, сечения которой плоскостями XZ и YZпредставляют собой графики плотности одномерных распределений.

Коэффициент множественной корреляции

D* – это D с добавочными верхней строкой и правым столбцом, состоящих из свободных членов уравнений.

Пример: Вычислить КМК:

Коэффициент корреляции рангов (объединенные ранги)

Анализ информации неподдающейся количественной оценке.

На экзаменах разные экзаменаторы ставят одним и тем же студентам разные оценки. Чтобы исключить элемент субъективизма, всех учащихся располагают в соответствии со степенью их способностей и ранжируют. Корреляция между рангами значительно точнее отражает взаимосвязь.

Есть n учащихся и ранги по некоторому фактору А: X1…Xn и по фактору B: Y1…Yn.

Xi, Yi – перестановки n первых натуральных чисел.

Xk-Yk=dk – мера тесноты связи A и B. Если все dk=0, то A и B полностью соответствуют.

Последнее выражение – коэффициент корреляции рангов Спирмена.

Существуют и другие показатели тесноты связи:

ККР Кендела: удобен для углубленных исследований, когда невозможно установит ранговые различия. Строятся объединенные усредненные ранги и

ti – число объединенных рангов.

Метод ранговой корреляции

Позволяет анализировать множество факторов и выделять доминирующие.

Для построения математической модели процесса необходимо выделить из множества факторов доминирующие. На первом этапе это делается с помощью экспертных оценок: максимальному кругу специалистов предлагается расположить факторы в порядке убывания степени влияния. При этом предлагается максимально полный список факторов, хотя каждый может включать в этот список дополнительные факторы.

Результат – матрица рангов, которая строится с учетом квалификации опрашиваемого: показания специалистов умножаются на коэффициент квалификации. Чем меньше сумма рангов фактора, тем более важное место он занимает, тем большее влияние он оказывает на выходной параметр.

Если распределение на диаграмме близко к равномерному, то все факторы должны учитываться. Обычно отмечается, что опрос не дал желаемого результата.

Если не равномерно, но изменение рангов не велико, значит специалисты делают различия между факторами, но неуверенно. Таким образом, надо учитывать все факторы.

Наиболее благоприятен случай быстрого экспоненциального спада суммы рангов. Малозначащие факторы отсеиваются. Для оценки степени согласованности мнений специалистов вычисляется коэффициент конкордации:

m – число специалистов

n – число факторов.

Чем больше W, тем больше степень согласованности. Если W=0, то согласованность отсутствует. При W=1 – полная согласованность.

Планирование эксперимента

Классический регрессионный и корреляционный анализ базируются на пассивном эксперименте, который сводится к сбору и обработке данных, полученных в результате наблюдения за процессом или явлением.

Привлекательность пассивного эксперимента в том, что он избавляет от необходимости тратить время и средства на постановку опытов. Полученные результаты в виде уравнения регрессии можно затем использовать для управления процессом. Однако пассивный эксперимент имеет ряд недостатков:

1. При сборе экспериментальных данных на реальном действующем промышленном объекте во избежание появления брака возможны лишь незначительные изменения параметров процесса. При этом интервалы варьирования параметров оказываются столь малыми, что изменение выходной величины будет в значительной степени обусловлено воздействием случайных факторов.

2. Часто упускают из вида важные факторы из-за невозможности их измерения или регистрации.

3. При пассивном эксперименте нельзя произвольно варьировать параметры. В результате этого экспериментальные точки часто располагаются неудачно и при большом количестве опытов затрудняют точное описание процесса.

Активный эксперимент

Ставится по плану. Достоинства:

1. Появляется четкая логическая схема всего исследования.

2. Повышается эффективность исследования. Оказывается возможным извлечь максимальное количество информации.

3. Обработка результатов эксперимента осуществляется стандартными приемами.

4. Планирование эксперимента позволяет обеспечить случайный порядок проведения опытов (рандомизация).

Отпадает необходимость в жесткой стабилизации мешающих факторов.

Активный эксперимент эффективен в лабораторной практике, а пассивный – в производстве.

С помощью методов планирования эксперимента можно получить математическую модель изучаемого процесса в аналитическом виде при отсутствии сведений о механизме процесса.

Математическая модель процесса задается полиномом:

Чаще всего используется линейная модель:

План эксперимента определяет расположение точек в к-мерном факторном пространстве.

Матрица планирования: каждая строчка – условие проведения опыта, а столбец – значения переменной в различных опытах.

При выборе линейной модели достаточно варьировать каждый фактор на двух уровнях. Если при этом осуществляются все возможные комбинации из k факторов, то реализация эксперимента по такому плану называется полным факторным экспериментом типа 2k (ПФЭ 2k).

Построение математической модели методом ПФЭ проводится в следующем порядке:

1. Планирование эксперимента

2. Проведение эксперимента

3. Проверка воспроизводимости

4. Построение математической модели с проверкой статистической значимости всех коэффициентов

5. Проверка адекватности математической модели.

Центр плана (точка, вокруг которой ставится серия опытов) выбирается на основании априорных сведений о процессе.

Если эти сведения отсутствуют, то в качестве центра плана выбирается центр исследуемой области.