Решение антагонистических игр 2×2 в смешанных стратегиях
Если игра 2×2 имеет седловую точку, то ее решение очевидно.
Пусть игра 2×2 не имеет седловой точки. Требуется найти цену игры v и оптимальные смешанные стратегии обоих игроков:
.
Чистые стратегии, входящие в оптимальную стратегию с положительными вероятностями, называются активными стратегиями.
Для решения матричных игр 2´2 можно использовать аналитический и геометрический методы.
Аналитический метод
Теорема об активных стратегиях
Пусть v – цена игры, и
– оптимальные стратегии игроков. Тогда справедливы следующие утверждения:
– для любой активной стратегии i первого игрока выполняется равенство
E(i, y0) = v;
– для любой активной стратегии j второго игрока имеет место равенство
E(x0, j) = v.
В игре 2×2 все стратегии игроков являются активными (почему?)
Выигрыш игрока первого игрока, если он применяет оптимальную стратегию х0, а второй игрок свою активную стратегию 1 равен
По теореме об активных стратегиях этот выигрыш равен цене игры, т.е.
Аналогично для случая, когда первый игрок применяет оптимальную стратегию х0, а второй игрок активную стратегию 2:
Получаем:
(1)
Получили систему уравнений относительно .
Аналогичную систему получим для оптимальных стратегий второго игрока:
(2)
Решая эти системы, найдем неизвестные оптимальные стратегии игроков х0, у0 и цену игры v.
Цена игры ν общая для обоих игроков, поэтому при решении систем уравнений (1) и (2) должно получиться одинаковое значение ν.
Решение игры 2´2 в общем виде выглядит следующим образом
; х2 = 1 – х1;
; у2 = 1 – у1; (***)
.
Геометрический метод
Рассмотрим геометрическую интерпретацию игры 2×2.
Пусть игрок А применяет смешанную стратегию, а игрок В – активную стратегию В1. Тогда средний выигрыш игрока А будет:
Мы получили уравнение прямой, которую обозначим В1, т.к. она соответствует активной стратегии В1 игрока В.
Если игрок В применяет свою активную стратегию В2, а игрок А стратегию (х, (1 – х)), то выигрыш игрока А равен:
Видно, что какую бы стратегию ни применил В, игрок А гарантирует себе выигрыш не меньше, чем ордината ломаной В2МВ1.
Ломанная В2МВ1 (на рис. выделена полужирно) определяет минимальные возможные средние выигрыши игрока А при использовании им своих смешанных стратегий. Точка М (самая высокая точка ломанной) – определяет наилучший средний выигрыш игрока А из всех минимальных. Она соответствует оптимальной смешанной стратегии игрока А. При этом: если М имеет координаты (х, у), то р1 = 1 – х, р2 = х, ν = y.
Таким образом, задача сводится к нахождению координат точки М, которая является точкой пересечения прямых В1В1 и В2В2. Для нахождения уравнений прямых В1В1 и В2В2.можно воспользоваться уравнением прямой, проходящей через две точки:
,
с учетом того, что прямую В1В1 определяют точки (0; a11), (1; а21), а прямую В2В2 определяют точки (0; a12), (1; а22).
Для игрока В оптимальная смешанная стратегия находится аналогично, но точка М определяется не самой высокой точкой нижней ломанной, а самой низкой точкой высокой ломанной – полужирная ломанная на рисунке 2.
Пусть В применяет стратегию Y = (у, (1 – у)), а А применяет стратегию А1. Тогда проигрыш игрока В определяется точками прямой:
.
Эту прямую обозначим А1. Если А применяет стратегию А2, а В стратегию Y, то проигрыш В лежит на прямой А2:
Из графика видно, что какую бы стратегию ни применял игрок А, игрок В гарантирует себе проигрыш не более, чем ордината ломаной А1МА2.
Оптимальной стратегией игрока В будет такая стратегия Y = (у, (1 – у)), при которой ордината ломаной линии А1МА2 будет минимальна. Найдя координаты точки М (х, у), как точки пересечения прямых А1А1 и А2А2, компоненты оптимальной смешанной стратегии игрока В и цену игры: Y*(у1, у2), ν можно найти по следующим формулам:
q1 = 1 – x, q2 = x, ν = y.
Пример.
Решить игру с матрицей платежей
Пусть оптимальная смешанная стратегия игрока А есть .
Тогда:
Найдем оптимальную смешанную стратегию игрока В.
Игру можно решить графически.
Пример.
Решить графически игру с матрицей А