1 2 / 2 2

В теории игр предполагается, что оба игрока действуют разумно, то есть стремятся к получению максимального выигрыша, считая, что соперник действует наилучшим (для себя) образом.

Дата: 2025-05-25; Просмотры: 39

Оценка:

0.00 из 5.00 — оценок

Скачиваний: 0

2.2.1.1. Действия игрока A

1-й шаг. В каждой строке матрицы A ищется минимальный элемент

, i = 1, 2, …, m.

Полученные числа a ₁ , a ₂ , …, a _m приписываются к заданной таблице в виде правого добавочного столбца

a ₁₁	a ₁₂	…	a _1n	a ₁
a ₂₁	a ₂₂	…	a _2n	a ₂
…	…	…	…	…
a_m ₁	a_m ₂	…	a_mn	a _m

Пояснение. Выбирая стратегию A_i, игрок A вправе рассчитывать на то, что в результате разумных действий противника (игрока В) он выиграет не меньше чем a _i.

2-й шаг. Среди чисел a ₁ , a ₂ , …, a _m выбирается максимальное число

или, подробнее,

Специально отметим, что выбранное число a является одним из элементов заданной матрицы А.

Пояснение. Действуя наиболее осторожно и рассчитывая на наиболее разумное поведение противника, игрок A должен остановиться на той стратегии А_r, для которой число a _i - является максимальным.

Если игрок A будет придерживаться стратегии, выбранной описанным выше способом, то при любом поведении игрока B игроку A гарантирован выигрыш, не меньший a.

Число a называется нижней ценой игры.

Принцип построения стратегии игрока A, основанный на максимизации минимальных выигрышей, называется принципом максимина, а выбираемая в соответствии с этим принципом стратегия A_i₀ — максиминной стратегией игрока А.

2.2.1.2. Действия игрока В

1-й шаг. В каждом столбце матрицы A ищется максимальный элемент

, k = 1, 2, …, n.

Полученные числа b ₁ , b ₂ , …, b _n приписываются к заданной таблице в виде нижней добавочной строки

a ₁₁	a ₁₂	…	a _1n	a ₁
a ₂₁	a ₂₂	…	a _2n	a ₂
…	…	…	…	…
a_m ₁	a_m ₂	…	a_mn	a _m
b ₁	b ₂	…	b _n

Пояснение. Выбирая стратегию В_k, игрок B должен рассчитывать на то, что в результате разумных действий противника (игрока А) он проиграет не больше чем β_k.

2-й шаг. Среди чисел b ₁ , b ₂ , …, b _n выбирается минимальное число

или, подробнее,

Выбранное число β также является одним из элементов заданной матрицы А.

Пояснение. Действуя наиболее осторожно и рассчитывая на наиболее разумное поведение противника, игрок B должен остановиться на той стратегии В_k, для которой число β_k является минимальным.

Если игрок B будет придерживаться стратегии, выбранной описанным выше способом, то при любом поведении игрока A игроку B гарантирован проигрыш, не больший β. Число β называется верхней ценой игры.

Принцип построения стратегии игрока B, основанный на минимизации максимальных потерь, называется принципом минимакса, а выбираемая в соответствии с этим принципом стратегия В_k₀ — минимаксной стратегией игрока В.

Нижняя цена игры a и верхняя цена игры β всегда связаны неравенством a ≤ β .

Замечание. Реализация описанного алгоритма требует 2тп - 1 сравнений элементов матрицы А:

(n - 1)m + т - 1 = тп - 1

сравнений для определения a,

(n - 1)m + т - 1 = тп - 1

сравнений для определения β и одно сравнение полученных чисел a и b.

Если

a = β,

или, подробнее,

= a_i ₀ _k ₀ =

то ситуация {A_i₀, B_k₀} оказывается равновесной, и ни один из игроков не заинтересован в том, чтобы ее нарушить.

В том случае, когда нижняя цена игры равна верхней цене игры, их общее значение называется просто ценой игры и обозначается через v.

Цена игры совпадает с элементом а_i_0k0 матрицы игры A, расположенным на пересечении i⁰ - й строки (стратегия A_i₀ игрока А) и k⁰ - го столбца (стратегия В_k₀ игрока В) — минимальным в своей строке и максимальным в своем столбце.

Этот элемент называют седловой точкой матрицы A, или точкой равновесия, а про игру говорят, что она имеет седловую точку.

Стратегии А_i₀ и В_k₀, соответствующие седловой точке, называются оптимальными, а совокупность оптимальных ситуаций и ценs игры — решением матричной игры с седловой точкой.

Замечание. Седловых точек в матричной игре может быть несколько, но все они имеют одно и то же значение.

Матричные игры с седловой точкой важны и интересны, однако более типичным является случай, когда применение описанного алгоритма приводит к неравенству a < β.

Как показывает следующий пример, в этом случае предложенный выбор стратегий уже, вообще говоря, к равновесной ситуации не приводит, и при многократном ее повторении у игроков вполне могут возникнуть мотивы к нарушению рекомендаций, основанных на описанном алгоритме действий игроков A и В.

<< < Предыдущая

1 2 / 2 2