Решение антагонистических игр m´n. Сведение матричной игры к задаче линейного программирования

Пусть дана игра m´n в нормальной форме, т.е.

Будем считать, что все элементы матрицы больше 0. Если это не так, то ко всем элементам можно прибавить такое число L>0, например,

,

где r > 1, чтобы все элементы стали положительными. При этом цена игры возрастает на L, но оптимальные стратегии не меняются. Т.о. aij >0, значит, v > 0

Пусть игрок А применит свою оптимальную стратегию . Тогда его выигрыш будет не менее v при любых действиях игрока В. В частности, если игрок В применит свою чистую стратегию В j, то выигрыш А составит:

j = (1, …, n)

Поделим это неравенство на v и, обозначив

(i = 1, …, m),

получим:

zi >= 0 j = (1, …, n)

Вероятности (i = 1, …, m) должны удовлетворять условию

.

Поделим это выражение на v и в новых обозначениях запишем

Поскольку игрок А стремиться к максимуму v, то целевая функция будет иметь вид:

Т.о. имеем:

(1)

Задача (1) – задача линейного программирования.

Пусть – решение задачи (1).

Тогда

; (i = 1, …, m).

 

Аналогичные рассуждения можно проделать для игрока В:

Пусть он применяет оптимальную смешанную стратегию , а игрок А – чистую стратегию А i (i = 1, …, m). Тогда проигрыш игрока В составит величину не более v:

(i = 1, …, m).

Разделим это неравенство на v > 0 и, обозначив

(j = 1, …, n), получим .

Вероятности (i = 1, …, m) должны удовлетворять условию

.

Поделим это выражение на v и в новых обозначениях получим:

.

Поскольку игрок В стремиться минимизировать проигрыш, т.е.


v ® min,

получим функцию

.

Т.о. имеем задачу линейного программирования:

(2)

Пусть – решение (2).

Тогда

Легко видеть, что задачи (1) и (2) представляют собой пару взаимодвойственных задач линейного программирования. Т.о., решение антагонистической игры m´n можно найти путем решения пары взаимодвойственных задач линейного программирования.

 

Пример

Две отрасли могут осуществлять капитальные вложения в 3 объекта. Стратегии отраслей: i-я стратегия состоит в финансировании i-го объекта (i = 1, 2, 3). Учитывая особенности вкладов и местные условия, прибыли первой отрасли выражаются следующей матрицей:

Величина прибыли первой отрасли считается такой же величиной убытка для второй отрасли - представленная игра может рассматриваться как игра двух игроков с нулевой суммой.

Рассмотрим игрока А. Будем искать оптимальную смешанную стратегию игрока А: Х ( х1, х2, х3), где х i – частота (вероятность) использования игроком А своей i-стратегии ( i = 1, 2, 3).Обозначим цену игры (средний выигрыш) – v.

Чтобы свести матричную игру для игрока А к задаче линейного программирования преобразуем платежную матрицу так, чтобы все ее элементы были больше нуля – прибавим ко всем элементам матрицы число 4. Получаем преобразованную платежную матрицу: