Учитывая, что
получаем систему уравнений для определения оптимальной стратегии S*A и цены игры v:Решая эту систему, получим оптимальную стратегию
и цену игры
Применяя теорему об активных стратегиях при отыскании
- оптимальной стратегии игрока В, получаем, что при любой чистой стратегии игрока А (А1 или А2) средний проигрыш игрока В равен цене игры v, т.е.Тогда оптимальная стратегия
( ) определяется формулами:Применим полученные результаты для отыскания оптимальных стратегий для игры, рассмотренной выше. Игра задана платежной матрицей без седловой точки:
Поэтому ищем решение в смешанных стратегиях: для игрока А средний выигрыш равен цене игры v (при В1 и В2) для игрока В средний проигрыш равен цене игры v (при А1 и А2). Системы уравнений приведенные выше в данном случае имеют вид:
Решая эти системы, получаем
v = 0.Это означает, что оптимальная стратегия каждого игрока состоит в том, чтобы чередовать свои чистые стратегии случайным образом, выбирая каждое из убежищ с вероятностью -3 и 4 при этом средний выигрыш равен 0.
Оптимальное решение игры двух лиц с нулевой суммой.
Определите оптимальные стратегии и цену игры. Для 1) - в чистых стратегиях, для 2) - в смешанных.
1)
2)Таблица 5
B1 | B2 | B3 | B4 | ||
A1 | 2 | 3 | 4 | 2 | 2 |
A2 | 3 | 5 | 2 | 4 | 2 |
A3 | 2 | 5 | 4 | 6 | 2 |
3 | 5 | 4 | 6 |
Решение.
Все расчеты удобно проводить в таблице, к которой, кроме матрицы Р, введены столбец
и строка (табл.1). Анализируя строки матрицы (стратегии игрока А), заполняем столбец : а1 = 2; а2 = 2; а3 = 2 - минимальные числа в строках 1, 2,3. Аналогично = 3; = 5; = 4; = 6 - максимальные числа в столбцах 1, 2, 3 соответственно. Нижняя цена игры , (2; 2;2) = 2 (наибольшее число в столбце
) и верхняя цена игры , (3; 5; 4;6) = 3 (наименьшее число в строке
). Эти значения не равны, т.е. , и, так как они достигаются ни на одной и той же паре стратегий, то игра седловой точки не имеет.И, так как игра седловой точки не имеет, то применение чистых стратегий не дает оптимального решения игры. В таком случае можно получить оптимальное решение случайным образом чередуя чистые стратегии.
Пусть игра задана платежной матрицей
Средний выигрыш игрока А, если он использует оптимальную смешанную стратегию
,а игрок В чистую стратегию В1 (это соответствует первому столбцу платежной матрицы Р), равен цене игры v:
Тот же средний выигрыш получает игрок А, если 2-й игрок применяет стратегию В2, т.е.
.Учитывая, что
получаем систему уравнений для определения оптимальной стратегии S*A и цены игры v:Решая эту систему, получим оптимальную стратегию
и цену игры
Применяя теорему об активных стратегиях при отыскании
- оптимальной стратегии игрока В, получаем, что при любой чистой стратегии игрока А (А1 или А2) средний проигрыш игрока В равен цене игры v, т.е.Тогда оптимальная стратегия
( ) определяется формулами:Применим полученные результаты для отыскания оптимальных стратегий для игры, рассмотренной выше.
Игра задана платежной матрицей без седловой точки:
Поэтому ищем решение в смешанных стратегиях: для игрока А средний выигрыш равен цене игры v (при В1 и В2) для игрока В средний проигрыш равен цене игры v (при А1 и А2). Системы уравнений приведенные выше в данном случае имеют вид:
Решая эти системы, получаем
v = 0.Это означает, что оптимальная стратегия каждого игрока состоит в том, чтобы чередовать свои чистые стратегии случайным образом, выбирая каждое из убежищ с вероятностью -1 и 2 при этом средний выигрыш равен 0.