Смекни!
smekni.com

Применение алгоритмов теории игр в экономических системах (стр. 5 из 8)

Игра m

n, (где m³3, n³3) заданную платежной матрицей А:

Пусть платежная матрица не содержит седловой точки, т.е. игра решается в смешанных стратегиях:

.

Применение игроком 1 оптимальной смешанной стратегии S1* гарантирует ему средний выигрыш не меньше цены игры g независимо от поведения игрока 2(gj≥ g).

Игрок 2, применяя оптимальную смешанную стратегию S2*, гарантирует для себя минимальный проигрыш (gI

g).

Учитывая данное условие, задачу линейного программирования можно записать следующим образом:

1) для игрока 1:

(4)

2) для игрока 2:

(5)

Смысл этих систем уравнений заключается в следующем: игрок 1 стремится увеличить цену игры (g→max), т.е. он действует так, чтобы его средний выигрыш при использовании его стратегии с вероятностями рi для любой j-й стратегии игрока 2 был не меньше величины g, которую он стремится увеличить. Игрок 2 стремится уменьшить свой проигрыш (g→min), т.е. он действует так, чтобы его средний проигрыш при использовании его стратегий с вероятностями qj при любой i-й стратегии игрока 1 не превышал величину g, которую он стремиться уменьшить.

Разделив левую и правую часть неравенств (4) и (5) на цену игры g > 0 и обозначив

(6)

получим уравнения (7) и (8) в следующем виде:

(7)

. (8)

Из равенств

и выражений (6) следует, что переменные (xi) и (yj) удовлетворяют условиям:
. Таким образом, цена игры определяется как:
.

Оптимальные стратегии

определяются как:

.

Теорема: Применение оптимальной смешанной стратегии обеспечивает игроку максимальный средний выигрыш (или минимальный средний проигрыш), равный цене игры γ, независимо от того, какие действия предпринимает другой игрок, если только он не выходит за пределы своих активных (оптимальных смешанных) стратегий [15].

1.6.3 Геометрический метод решения игр

Графический метод решения игр выполняется по шагам:

1) В системе координат XOY по оси абсцисс (ОХ) откладывается отрезок, длина которого равна 1. Левый конец отрезка (точка Х=0) соответствует стратегии А1, правый (точка Х=1) – стратегии А2. Промежуточные точки Х соответствуют некоторым смешанным стратегиям S1=(p1, p2).

2) По оси ординат (OY) откладываются выигрыши при стратегии А1. На линии, параллельной оси ординат, в точке 1 откладываются выигрыши при стратегии А2.

Пусть имеется игра с платежной матрицей:

.

Если игрок 2 применяет стратегию В1, то выигрыш игрока 1 при использовании чистых стратегий А1 и А2 составляет соответственно 0,4 и 0,6. Соединим эти точки прямой В1В1.

Ордината любой точки отрезка В1В1 равна величине выигрыша игрока 1 при принятии им стратегии А1 и А2 с соответствующими вероятностями р1 и р2.

Аналогично прямая В2В2 соответствует стратегии игрока 2. Точка пересечения В1В1 и В2В2 определяет цену игры γ. Ординаты точек В2В2 равны среднему стратегий А1 и А2 с вероятностями р1 и р2.

Ломаная В1NB2 – нижняя граница выигрыша, получаемая игроком 1. В точке N он максимален.

Таким образом, оптимальная стратегия первого игрока: S1*=(0,375; 0,625); цена игры (максимальный выигрыш) γ =55% [18].

Рисунок 1.5 – Графическая интерпретация решения игры

1.7 Понятие о статистических играх

Принятие управленческих решений предполагает наличие ситуаций выбора наиболее выгодного варианта поведения из нескольких имеющихся вариантов в условиях неопределённости. Такие задачи могут быть описаны матричными играми особого типа, в которых игрок взаимодействует не со вторым игроком, а с окружающей средой. Объективно окружающая среда не заинтересована в проигрыше игрока. В процессе принятия решения о выборе варианта поведения игрок имеет информацию о том, что окружающая среда может принять одно из нескольких возможных состояний и сталкивается с неопределённостью относительно того конкретного состояния, которое примет окружающая среда в данный момент времени.

Матричная игра, в которой игрок взаимодействует с окружающей средой, не заинтересованной в его проигрыше, и решает задачу определения наиболее выгодного варианта поведения с учётом неопределённости состояния окружающей среды, называется статистической игрой или «игрой с природой». Игрок в этой игре называется лицом, принимающим решение (ЛПР).

В общем виде платёжная матрица статистической игры приведена в таблице 2.

Таблица 2

Общий вид платёжной матрицы статистической игры

S1 S2 Sn
A1 A11 A12 A1n
A2 A21 A22 A2n..
An Am1 Am2 Amn

В данной игре строки матрицы (Ai ) - стратегии ЛПР, а столбцы матрицы (Sj) – состояния окружающей среды.

Критерии принятия решения

ЛПР определяет наиболее выгодную стратегию в зависимости от целевой установки, которую он реализует в процессе решения задачи. Результат решения задачи ЛПР определяет по одному из критериев принятия решения. Для того, чтобы прийти к однозначному и по возможности наиболее выгодному варианту решению, необходимо ввести оценочную (целевую) функцию. При этом каждой стратегии ЛПР (Ai) приписывается некоторый результат Wi, характеризующий все последствия этого решения. Из массива результатов принятия решений ЛПРвыбирает элемент W, который наилучшим образом отражает мотивацию его поведения [17].

1.7.1 Критерий максимального математического ожидания выигрыша

Критерий максимального математического ожидания выигрыша применяется в тех случаях, когда ЛПР известны вероятности состояний окружающей среды. Платёжная матрица дополняется столбцом, каждый элемент которого представляет собой значение математического ожидания выигрыша при выборе соответствующей стратегии ЛПР:

(9)

где pj –вероятность j-го состояния окружающей среды.

Оптимальной по данному критерию считается та стратегия ЛПР, при выборе которой значение математического ожидания выигрыша максимально: W = maxWi

Применение критерия максимального математического ожидания выигрыша, таким образом, оправдано, если ситуация, в которой принимается решение, следующая:

1. ЛПР известны вероятности всех состояний окружающей среды;

2. Минимизация риска проигрыша представляется ЛПР менее существенным фактором принятия решения, чем максимизация среднего выигрыша.

Необходимость иметь информацию о вероятностях состояний окружающей среды ограничивает область применения данного критерия.

1.7.2 Критерий недостаточного основания Лапласа

Данный критерий используется при наличии неполной информации о вероятностях состояний окружающей среды в задаче принятия решения. Вероятности состояний окружающей среды принимаются равными и по каждой стратегии ЛПР в платёжной матрице определяется, таким образом, среднее значение выигрыша:

. (10)

Оптимальной по данному критерию считается та стратегия ЛПР, при выборе которой значение среднего выигрыша максимально: W = maxWi.

Использование данного критерия оправдано в следующей ситуации:

1. ЛПР не имеет информации, либо имеет неполную информацию о вероятностях состояний окружающей среды;

2. Вероятности состояний окружающей среды близки по своим значениям;