a. Есть ли вообще между Х и У корреляционная зависимость, т.е. наблюдается ли закономерное изменение условных средних
в связи с изменением Х?b. Если корреляционная зависимость существует, то в какой степени она отличается от функциональной?
Для решения данной задачи могут использоваться различные модели. Наиболее часто используется регрессионная и корреляционная модель.
Регрессионная модель предполагает, что зависимая переменная У является случайной величиной, а значения независимой переменной задаются экспериментатором произвольно. Например, исследуя зависимость скорости мышечного сокращения от величины поднимаемого груза, можно наметить, какие грузы должен поднимать испытуемый.
Корреляционная модель предполагает, что обе переменные – случайные величины.
Простейшей формой связи между двумя переменными является линейная зависимость вида У=а+bX. Параметр а носит название начальной ординаты. Параметр b носит название коэффициента регрессии, он характеризует наклон прямой линии.
Расчет параметров уравнения регрессии производится по методу наименьших квадратов:
.Для выполнения этого учловия параметры находят из решения системы уравнений:
Которое можно представить в виде готовых формул:
.Уравнение регрессии служит для анализа формы связи между двумя признаками.
1 Дерево решений
Дерево решений используют, когда нужно принять несколько решений в условиях неопределенности, когда каждое решение зависит от исхода предыдущего или исхода испытаний. Составляя “дерево” решений нужно нарисовать “ствол” и “ветви”, отражающие структуру проблемы. Располагаются “деревья” слева направо. “Ветви” обозначают возможные альтернативные решения, которые могут быть приняты, и возможные исходы, возникающие в результате этих решений.
Квадратные “узлы” обозначают места, где принимаются решение, круглые “узлы” - появление исходов. Так как принимающий решение не может влиять на появление исходов, ему остается лишь вычислять вероятность их появления.
Когда все решения и их исходы указаны на “дереве”, просчитывается каждый из вариантов, и в конце проставляется его денежный доход. Все расходы, вызванные решением, проставляются на соответствующей “ветви”.
Рассмотрим пример: "Играть ли в гольф?" Чтобы решить задачу, т.е. принять решение, играть ли в гольф, следует отнести текущую ситуацию к одному из известных классов (в данном случае - "играть" или "не играть"). Для этого требуется ответить на ряд вопросов, которые находятся в узлах этого дерева, начиная с его корня.
Первый узел нашего дерева "Солнечно?" является узлом проверки, т.е. условием. При положительном ответе на вопрос осуществляется переход к левой части дерева, называемой левой ветвью, при отрицательном - к правой части дерева. Таким образом, внутренний узел дерева является узлом проверки определенного условия. Далее идет следующий вопрос и т.д., пока не будет достигнут конечный узел дерева, являющийся узлом решения. Для нашего дерева существует два типа конечного узла: "играть" и "не играть" в гольф.
В результате прохождения от корня дерева (иногда называемого корневой вершиной) до его вершины решается задача классификации, т.е. выбирается один из классов - "играть" и "не играть" в гольф.
Любая модель, представленная в виде дерева решений, является интуитивной и упрощает понимание решаемой задачи. Результат работы алгоритмов конструирования деревьев решений легко интерпретируется пользователем. Это свойство деревьев решений не только важно при отнесении к определенному классу нового объекта, но и полезно при интерпретации модели классификации в целом. Дерево решений позволяет понять и объяснить, почему конкретный объект относится к тому или иному классу.
Алгоритм конструирования дерева решений не требует от пользователя выбора входных атрибутов (независимых переменных). На вход алгоритма можно подавать все существующие атрибуты, алгоритм сам выберет наиболее значимые среди них, и только они будут использованы для построения дерева.
Точность моделей, созданных при помощи деревьев решений, сопоставима с другими методами построения классификационных моделей (статистические методы, нейронные сети).
2 Игры
В практике часто встречаются конфликтные ситуации. Игра – это упрощенная модель конфликта. В отличии от конфликта игра ведется по четким правилам. Для решения конфликтов разработан специальный аппарат – теория игр. Для задания игры необходимо определить:
1. варианты действий игроков
2. объем информации каждого игрока о поведении противника
3. выигрыш, к которому приводит совокупность действий игроков.
Игра в которой участвуют два игрока называется парной. В игре где участвуют более двух игроков называется множественной.
Игра в которой выигрыш одного из игроков равен проигрышу другого, называют игрой с нулевой суммой (антагонистической игрой)
Естественным обобщением матричных игр являются бесконечные антагонистические игры (БАИ), в которых хотя бы один из игроков имеет бесконечное количество возможных стратегий. Мы будем рассматривать игры двух игроков, делающих по одному ходу, и после этого происходит распределение выигрышей. При формализации реальной ситуации с бесконечным числом выборов можно каждую стратегию сопоставить определённому числу из единичного интервала, т.к. всегда можно простым преобразованием любой интервал перевести в единичный и наоборот.
Введём определения и обозначения : [0; 1] – единичный промежуток, из которого игрок может сделать выбор;
х – число (стратегия), выбираемое игроком 1;
y – число (стратегия), выбираемое игроком 2;
Мi(x,y) – выигрыш i-го игрока; G (X,Y,M1,M2) – игра двух игроков, с ненулевой суммой, в которой игрок 1 выбирает число х из множества Х, игрок 2 выбирает число y из множества Y, и после этого игроки 1 и 2 получают соответственно выигрыши M1(x, y) и M2(x, y). Пусть, далее, G (X,Y,M) – игра двух игроков с нулевой суммой, в которой игрок 1 выбирает число х, игрок 2 – число y, после чего игрок 1 получает выигрыш М(x, y) за счёт второго игрока.
Большое значение в теории БАИ имеет вид функции выигрышей M(x, y). Так, в отличии от матричных игр, не для всякой функции M(x, y) существует решение. Будем считать, что выбор определённого числа игроком означает применение его чистой стратегии, соответствующей этому числу. По аналогии с матричными играми назовём чистой нижней ценой игры величину
V1 = M(x, y) или V1 = M(x, y),
а чистой верхней ценой игры величину
V2 = M(x, y) или V2 = M(x, y),
Для матричных игр величины V1 и V2 всегда существуют, а в бесконечных играх они могут не существовать.
Естественно считать, что, если для какой-либо бесконечной игры величины V1 и V2 существуют и равны между собой (V1 = V2 = V), то такая игра имеет решение в чистых стратегиях, т.е. оптимальной стратегией игрока 1 есть выбор числа xoÎX и игрока 2 – числа yoÎY, при которых M(xo, yo) = V, в этом случае V называется ценой игры, а (xo, yo) – седловой точкой в чистых стратегиях.
Пример 1. Игрок 1 выбирает число х из множества Х = [0; 1], игрок 2 выбирает число y из множества Y = [0; 1]. После этого игрок 2 платит игроку 1 сумму
M(x, y) = 2х2- y2.
Поскольку игрок 2 хочет минимизировать выигрыш игрока 1, то он определяет
(2x2 - y2) = 2х2- 1,т.е. при этом y = 1. Игрок 1 желает максимизировать свой выигрыш, и поэтому определяет
( M(x, y)) = (2х2- 1) = 2-1 = 1,