В теории игр предполагается, что оба игрока действуют разумно, то есть стремятся к получению максимального выигрыша, считая, что соперник действует наилучшим (для себя) образом.

2.2.1.1. Действия игрока A

1-й шаг. В каждой строке матрицы A ищется минимальный элемент

, i = 1, 2, …, m.

Полученные числа a 1 , a 2 , …, a m приписываются к заданной таблице в виде правого добавочного столбца

a 11 a 12 a 1n a 1
a 21 a 22 a 2n a 2
am 1 am 2 amn a m

 

Пояснение. Выбирая стратегию Ai, игрок A вправе рассчитывать на то, что в результате разумных действий противника (игрока В) он выиграет не меньше чем a i.

2-й шаг. Среди чисел a 1 , a 2 , …, a m выбирается максимальное число

или, подробнее,

.

Специально отметим, что выбранное число a является одним из элементов заданной матрицы А.

Пояснение. Действуя наиболее осторожно и рассчитывая на наиболее разумное поведение противника, игрок A должен остановиться на той стратегии Аr, для которой число a i - является максимальным.

Если игрок A будет придерживаться стратегии, выбранной описанным выше способом, то при любом поведении игрока B игроку A гарантирован выигрыш, не меньший a.

Число a называется нижней ценой игры.

Принцип построения стратегии игрока A, основанный на максимизации минимальных выигрышей, называется принципом максимина, а выбираемая в соответствии с этим принципом стратегия Ai0максиминной стратегией игрока А.

2.2.1.2. Действия игрока В

1-й шаг. В каждом столбце матрицы A ищется максимальный элемент

, k = 1, 2, …, n.

Полученные числа b 1 , b 2 , …, b n приписываются к заданной таблице в виде нижней добавочной строки

a 11 a 12 a 1n a 1
a 21 a 22 a 2n a 2
am 1 am 2 amn a m
b 1 b 2 b n

Пояснение. Выбирая стратегию Вk, игрок B должен рассчитывать на то, что в результате разумных действий противника (игрока А) он проиграет не больше чем βk.

2-й шаг. Среди чисел b 1 , b 2 , …, b n выбирается минимальное число

или, подробнее,

.

Выбранное число β также является одним из элементов заданной матрицы А.

Пояснение. Действуя наиболее осторожно и рассчитывая на наиболее разумное поведение противника, игрок B должен остановиться на той стратегии Вk, для которой число βk является минимальным.

Если игрок B будет придерживаться стратегии, выбранной описанным выше способом, то при любом поведении игрока A игроку B гарантирован проигрыш, не больший β. Число β называется верхней ценой игры.

Принцип построения стратегии игрока B, основанный на минимизации максимальных потерь, называется принципом минимакса, а выбираемая в соответствии с этим принципом стратегия Вk0минимаксной стратегией игрока В.

Нижняя цена игры a и верхняя цена игры β всегда связаны неравенством aβ .

Замечание. Реализация описанного алгоритма требует 2тп - 1 сравнений элементов матрицы А:

(n - 1)m + т - 1 = тп - 1

сравнений для определения a,

(n - 1)m + т - 1 = тп - 1

сравнений для определения β и одно сравнение полученных чисел a и b.

Если

a = β,

или, подробнее,

= ai 0 k 0 =

то ситуация {Ai0, Bk0} оказывается равновесной, и ни один из игроков не заинтересован в том, чтобы ее нарушить.

В том случае, когда нижняя цена игры равна верхней цене игры, их общее значение называется просто ценой игры и обозначается через v.

Цена игры совпадает с элементом аi0k0 матрицы игры A, расположенным на пересечении i0 - й строки (стратегия Ai0 игрока А) и k0 - го столбца (стратегия Вk0 игрока В) — минимальным в своей строке и максимальным в своем столбце.

Этот элемент называют седловой точкой матрицы A, или точкой равновесия, а про игру говорят, что она имеет седловую точку.

Стратегии Аi0 и Вk0, соответствующие седловой точке, называются оптимальными, а совокупность оптимальных ситуаций и ценs игры — решением матричной игры с седловой точкой.

Замечание. Седловых точек в матричной игре может быть несколько, но все они имеют одно и то же значение.

Матричные игры с седловой точкой важны и интересны, однако более типичным является случай, когда применение описанного алгоритма приводит к неравенству a < β.

Как показывает следующий пример, в этом случае предложенный выбор стратегий уже, вообще говоря, к равновесной ситуации не приводит, и при многократном ее повторении у игроков вполне могут возникнуть мотивы к нарушению рекомендаций, основанных на описанном алгоритме действий игроков A и В.