Если игра m´n не имеет седловой точки, то нахождение решения есть вообще довольно трудная задача, особенно при больших m и n.
Иногда эту задачу удается упростить, если предварительно уменьшить число стратегий путем вычеркивания некоторых излишних.
Излишние стратегии бывают: а) дублирующие и б) заведомо невыгодные. Рассмотрим, например, игру с матрицей:
А В
B1
B2
B3
B4
A1
A2
A3
A4
Нетрудно убедиться, что стратегия А3 в точности повторяет ("дублирует") стратегию А1 поэтому любую из этих двух стратегий можно вычеркнуть.
Далее, сравнивая почленно строки А1 и А2, видим, что каждый элемент строки А2 меньше (или равен) соответствующего элемента строки А1. Очевидно, что мы никогда не должны пользоваться стратегией А2; она является заведомо невыгодной. Вычеркивая А3 и А2, приводим матрицу к более простому виду:
А В
B1
B2
B3
B4
A1
A4
Далее замечаем, что для противника стратегия В3 заведомо невыгодна; вычеркивая ее, приводим матрицу к окончательному виду. Таким образом, игра 4´4 вычеркиванием дублирующих и заведомо невыгодных стратегий сведена к игре 2´3:
А В
B1
B2
B4
A1
A4
Процедура вычеркивания дублирующих и заведомо невыгодных стратегий всегда должна предшествовать решению игры.
Наиболее простыми случаями конечных игр, которые всегда можно решить элементарными способами, являются игры 2´2 и 2´m.
Рассмотрим игру 2´2 с матрицей:
А В
B1
B2
A1
a11
a12
A2
a21
a22
Здесь могут встретиться два случая:
1) игра имеет седловую точку;
2) игра не имеет седловой точки.
В первом случае решение очевидно: это пара стратегий, пересекающихся в седловой точке. В игре 2´2 наличие седловой точки всегда соответствует существованию заведомо невыгодных стратегий, которые должны быть вычеркнуты при предварительном анализе.
Пусть седловой точки нет и, следовательно, нижняя цена игры не равна верхней, a¹b. Требуется найти оптимальную смешанную стратегию игрока А:
Она отличается тем свойством, что, каковы бы ни были действия противника (если только он не выходит за пределы своих "полезных" стратегий), выигрыш будет равен цене игры n. В игре 2´2 обе стратегии противника являются "полезными", иначе игра имела бы решение в области чистых стратегий (седловую точку) Значит, если мы придерживаемся своей оптимальной стратегии то противник может пользоваться любой из своих чистых стратегий В1, В2, не изменяя среднего выигрыша v. Отсюда имеем два уравнения:
из которых, принимая во внимание, что p1+р2=1, получим
a11p1+ a21(1–p1)= a12p1+ a22(1–p1),
Цену игры v найдем, подставляя значения р1, р2 в любое из уравнений системы.
Если цена игры известна, то для определения оптимальной стратегии противника SB*= достаточно одного уравнения,
например:
a11q1+a12q2=v,
откуда, учитывая, что q1+ q2= 1, имеем:
Пример 1. Найдем решение игры 2´2, рассмотренной в примере с матрицей:
А В
B1
B2
A1
–1
A2
–1
1 Игра не имеет седловой точки (а = –1, b = +1), и, следовательно, решение должно лежать в области смешанных стратегий:
Нужно найти pl, p2, q1и q2
Для plимеем уравнение:
1×p1+(–1)×(1–p1)=(–1)×p1+1×(1–p1),
откуда:
Аналогично найдем:
Следовательно, оптимальная стратегия для каждого из игроков состоит в том, чтобы случайным образом чередовать обе свои чистые стратегии, пользуясь одинаково часто каждой из них; при этом средний выигрыш будет равен нулю.
В следующем примере мы рассмотрим более сложную игру, решение которой не является столь очевидным. Пример представляет собой элементарный образец игр, известных под названием игр с "обманом" или "введением в заблуждение". На практике в конфликтных ситуациях часто применяются разные способы введения противника в заблуждение (дезинформация, расстановка ложных целей и т.д.).
Пример 2. Игра состоит в следующем. Имеются две карты туз и двойка Игрок А наугад вынимает одну из них, В не видит, какую карту он вынул Если А вынул туза, он заявляет "у меня туз", и требует у противника 1 тенге. Если А вынул двойку, то он может либо (A1) сказать "у меня туз": и потребовать у противника 1 тенге, либо (А2) признаться, что у него двойка, и уплатить противнику 1 тенге.
Противник, если ему добровольно платят 1 тенге, может только принять его. Если же у него потребуют 1 тенге, то он может либо (В1) поверить игроку А, что у него туз, и отдать ему 1 тенге, либо (В2) потребовать проверки с тем, чтобы убедиться, верно ли утверждение А. Если в результате проверки окажется, что у А действительно туз, В должен уплатить А 2тенге. Если же окажется, что А обманывает и у него двойка, игрок А уплачивает игроку В 2тенге.
Требуется проанализировать игру и найти оптимальную стратегию каждого из игроков.
Решение. Игра имеет сравнительно сложную структуру, она состоит из одного обязательного случайного хода — выбора игроком А одной из двух карт — и двух личных ходов, которые, однако, необязательно осуществляются. Действительно, если А вынул туза, то он не делает никакого личного хода: ему предоставлена только одна возможность —потребовать 1 тенге, что он и делает. В этом случае личный ход — верить или не верить (т.е. платить или не платить 1 тенге.) — передается игроку В. Если А в результате первого случайного хода получил двойку, то ему предоставляется личный ход: уплатить 1 тенге или попытаться обмануть противника и потребовать 1 тенге (т.е. "не обманывать" или "обманывать"). Если А выбирает первое, то В остается только принять 1 тенге; если А выбрал второе, то игроку В предоставляется личный ход: верить или не верить А (т.е. уплатить А 1тенге или требовать проверки).
Стратегии каждого из игроков представляют собой правила, указывающие, как поступить игроку, когда ему предоставляется личный ход.
Очевидно, у А только две стратегии:
А1 — обманывать, А2 — не обманывать.
У В — тоже две стратегии:
В1 — верить, В2 — не верить.
Построим матрицу игры. Для этого вычислим средний выигрыш при каждой комбинации стратегий.
1. А1 B1 (А обманывает, В верит).
Если А получил туза (вероятность этого 1/2), то ему не предоставляется личного хода; он требует 1 тенге, и игрок В верит ему; выигрыш А в тенге равен 1.
Если А получил двойку (вероятность этого тоже 1/2), он согласно своей стратегии обманывает и требует 1 тенге; В ему верит и уплачивает; выигрыш А также равен 1. Средний выигрыш:
2. А1 В2 (А обманывает, В не верит).
Если А получил туза, у него нет личного хода; он требует 1 тенге; В согласно своей стратегии не верит и в результате проверки уплачивает 2 тенге (выигрыш А равен +2).
Если А получил двойку, он согласно своей стратегии требует 1 тенге; В согласно своей стратегии не верит; в результате А уплачивает 2 тенге (выигрыш А равен –2). Средний выигрыш равен:
3. А2 В1 (А не обманывает, В верит).
Если А вынул туза, он требует 1 тенге; В согласно своей стратегии уплачивает; выигрыш А равен +1. Если А вынул двойку, он согласно своей стратегии платит 1 тенге; В остается только принять (выигрыш А равен –1). Средний выигрыш равен:
4. А2 В2(А не обманывает, В не верит).
Если А вынул туза, он требует 1 тенге; В проверяет и в результате проверки уплачивает 2 тенге (выигрыш равен +2).
Если А вынул двойку, он уплачивает 1 тенге; В остается только принять (выигрыш равен –1).
Средний выигрыш равен:
Строим матрицу игры (см. ниже). Матрица не имеет седловой точки. Нижняя цена игры a = 0, верхняя цена игры b =1/2. Найдем решение игры в области смешанных стратегий.
А В
B1
(верить)
B2
(не верить)
A1
(обман)
A2
(не обман)
1/2
Применяя формулу для р1, получим:
т.е. игрок А должен в одной трети всех случаев пользоваться своей первой стратегией (обманывать), а в двух третях — второй (не обманывать) При этом он будет выигрывать в среднем цену игры
Значение v = 1/3 свидетельствует о том, что в данных условиях игра выгодна для А и невыгодна для В. Пользуясь своей оптимальной стратегией, А всегда может себе обеспечить положительный средний выигрыш.
Заметим, что, если бы А пользовался своей наиболее осторожной (максиминной) стратегией (в данном случае обе стратегии А1 и А2 являются максиминными), он имел бы средний выигрыш, равный нулю. Таким образом, применение смешанной стратегии дает А возможность реализовать свое преимущество над В, возникающее при данных правилах игры.