Используя алгоритм принципа минимакса (максимина) имеем:
= max = max {2, 4,1} = 4,
= min = min {5, 4, 6, 7} = 4.
Поскольку , то эта игра определена в чистых стратегиях или является игрой с седловой точкой. Седловая точка а22 = (А2,В2) = 4, цена игры =4. Таким образом, совокупность оптимальных стратегий А2 и В2 является решением игры.
Если игра не имеет седловой точки, то поиск решения игры приводит к применению сложной стратегии, состоящей в случайном применении двух и более чистых стратегий с определенными вероятностями. Такая сложная стратегия называется смешанной.
ü
Смешанной стратегией игроков А (В) называются выражения вида
, ,
где , , , ,
– вероятность использования чистой стратегии ,
– вероятность использования чистой стратегии .
Замечание.
Любая конченная игра имеет решение в чистых или смешанных стратегиях.
Матричные игры тесно взаимосвязаны с задачами линейного программирования.
Каждой матричной игре можно поставить в соответствие две двойственные задачи, отражающие интересы сторон.
Для игрока А задачу записывают по столбцам, для игрока В - по строкам; знаки неравенств для игрока А будут “ ”, для В – “ ”. Правые части ограничений и коэффициенты целевых функций в обеих задачах равны 1, у задачи для игрока А цель , у задачи для игрока В - max.
Для игрока А Для игрока В
где , , .
Последовательность действий при решении игры
1. Проверка матрицы игры на наличие седловой точки.
2. При отсутствии седловой точки сведение игры к двойственным задачам.
3. Решение одной из пары двойственных задач.
4. Выписывание решения игры в смешанных стратегиях.
Замечание.
Задача не изменится, если ко всем элементам платежной матрицы прибавить число.
Замечание.
Сократить размерность матрицы можно исключением одинаковых строк или столбцов, исключением больших столбцов или меньших строк.
Решение матричной игры в смешанных стратегиях рассмотрим на примере.
Пример 2.5.2.Решить матричную игру с платежной матрицей
Решение.Вначале, с помощью принципамаксимина (минимакса), определим минимаксную и максиминную стратегии. Для этого в строках платежной матрицы найдем минимальные числа, в столбцах – максимальные из числа.
А\В
B1
B3
B3
A1
–2
–2
A2
–1
–1
–1
A3
–3
–3
В нашем случае = max {–2, –1, –3} = –1, = min {4, 3, 1} = 1.
Таким образом, в нашем случае цена игры: .
Поскольку диапазон цены игры и платежная матрица содержат отрицательные числа, то ко всем элементам платежной матрицы следует прибавить число, которое приведет к положительному диапазону цены игры. Здесь это число равно 3.
Платежная матрица приобретет вид , новая цена игры будет принадлежать промежутку
.
Матричная игра сводится к паре двойственных задач линейного программирования.
Для игрока А
min z = x1 + x2 + x3
Для игрока В
max f = y1 + y2 + y3
Замечание.
Решать симплекс-методом целесообразно задачу для игрока В, поскольку в этой задаче нет необходимости вводить искусственные переменные.
Приведем ЗЛП для игрока В к каноническому виду и перейдем к минимуму:
min (– f) = – y1 – y2 – y3
Имеем двойственную ЗЛП, которую будем решать симплекс-методом:
Таблица 2.5.1
Симплексный метод решения ЗЛП
Базис
С
р0
–1
–1
–1
р1
р2
р3
р4
р5
р6
р4
1/1
р5
1/2
р6
1/7
z - строка
р4
6/7
17/7
–1/7
(6/7):5=6/35
р5
5/7
6/7
–2/7
(5/7):6=5/42
р1
–1
1/7
4/7
1/7
z – строка
–1/7
3/7
–1/7
р4
11/42
12/7
–5/6
2/21
(11/42):(12/7) =11/72
р2
–1
5/42
1/7
1/6
–1/21
(5/42):(1/7) =5/6
р1
–1
1/7
4/7
1/7
(1/7):(4/7) =1/4
z - строка
–11/42
2/7
–1/6
–1/7
р3
–1
11/72
7/12
–5/12
1/18
р2
–1
7/72
р1
–1
4/72
z – строка
–22/72
–1/6
–1/36
–1/9
Оптимальный план: у1 = 4/72, у2 =7/72, у3 =11/72, max f = – min (– f) = 22/72
Найдем v +3 = 1/f= 1:(22/72 ) = 36/11, значит цена игры равна v = 3/11.
Найдем вероятности использования чистых стратегий Bj: qj = yj · v
q1= , q2= , q3= ,
тогда оптимальная смешанная стратегия .
Оптимальный план х1 = 1/6, х2 = 1/36, х3 = 1/9. Найдем вероятности использования чистых стратегий Аi: pi = xi · v
p1= , p2= , p3= ,
тогда оптимальная смешанная стратегия .
Таким образом, игроку А рекомендуется из 11 раз стратегию А1 использовать 6 раз (чаще всего), стратегию А2 – 1 раз, стратегию А3 – 4 раза. Игроку В рекомендуется из 22 раз стратегию В1 использовать 4 раза, стратегию В2 – 7 раз, стратегию А3 – 11 раз (чаще всего). Если кто-то из участников будет отклоняться от этих рекомендаций, то он ухудшит свое собственное положение.