Учитывая, что
Решая эту систему, получим оптимальную стратегию
и цену игры
Применяя теорему об активных стратегиях при отыскании
Тогда оптимальная стратегия
Применим полученные результаты для отыскания оптимальных стратегий для игры, рассмотренной выше. Игра задана платежной матрицей без седловой точки:
Поэтому ищем решение в смешанных стратегиях: для игрока А средний выигрыш равен цене игры v (при В1 и В2) для игрока В средний проигрыш равен цене игры v (при А1 и А2). Системы уравнений приведенные выше в данном случае имеют вид:
Решая эти системы, получаем
Это означает, что оптимальная стратегия каждого игрока состоит в том, чтобы чередовать свои чистые стратегии случайным образом, выбирая каждое из убежищ с вероятностью -3 и 4 при этом средний выигрыш равен 0.
Оптимальное решение игры двух лиц с нулевой суммой.
Определите оптимальные стратегии и цену игры. Для 1) - в чистых стратегиях, для 2) - в смешанных.
1)
Таблица 5
B1 | B2 | B3 | B4 | | |
A1 | 2 | 3 | 4 | 2 | 2 |
A2 | 3 | 5 | 2 | 4 | 2 |
A3 | 2 | 5 | 4 | 6 | 2 |
| 3 | 5 | 4 | 6 | |
Решение.
Все расчеты удобно проводить в таблице, к которой, кроме матрицы Р, введены столбец
2) = 2 (наибольшее число в столбце
6) = 3 (наименьшее число в строке
И, так как игра седловой точки не имеет, то применение чистых стратегий не дает оптимального решения игры. В таком случае можно получить оптимальное решение случайным образом чередуя чистые стратегии.
Пусть игра задана платежной матрицей
Средний выигрыш игрока А, если он использует оптимальную смешанную стратегию
а игрок В чистую стратегию В1 (это соответствует первому столбцу платежной матрицы Р), равен цене игры v:
Тот же средний выигрыш получает игрок А, если 2-й игрок применяет стратегию В2, т.е.
Учитывая, что
Решая эту систему, получим оптимальную стратегию
и цену игры
Применяя теорему об активных стратегиях при отыскании
Тогда оптимальная стратегия
Применим полученные результаты для отыскания оптимальных стратегий для игры, рассмотренной выше.
Игра задана платежной матрицей без седловой точки:
Поэтому ищем решение в смешанных стратегиях: для игрока А средний выигрыш равен цене игры v (при В1 и В2) для игрока В средний проигрыш равен цене игры v (при А1 и А2). Системы уравнений приведенные выше в данном случае имеют вид:
Решая эти системы, получаем
Это означает, что оптимальная стратегия каждого игрока состоит в том, чтобы чередовать свои чистые стратегии случайным образом, выбирая каждое из убежищ с вероятностью -1 и 2 при этом средний выигрыш равен 0.