Платежная матрица

В зависимости от числа возможных стратегий игры делятся на "конечные" и "бесконечные".

Конечной называется игра, в которой у каждого игрока имеется только конечное число стратегий.

Конечная игра, в которой игрок А имеет m стратегий, а игрок В — n стратегий, называется игрой m´n.

Рассмотрим игру m´n двух игроков А и В ("мы" и "противник").

Будем обозначать наши стратегии A₁, А₂,…, А_m; стратегии противника — B₁, В₂,..., В_n.

Пусть каждая сторона выбрала определенную стратегию; для нас это будет А_i для противника. В_j.

Если игра состоит только из личных ходов, то выбор стратегий A_i, В_j однозначно определяет исход игры — наш выигрыш. Обозначим его a_ij.

Если игра содержит, кроме личных, случайные ходы, то выигрыш при паре стратегий А_i, В_j есть величина случайная, зависящая от исходов всех случайных ходов. В этом случае естественной оценкой ожидаемого выигрыша является его среднее значение (математическое ожидание). Мы будем обозначать одним и тем же знаком a_ij как сам выигрыш (в игре без случайных ходов), так и его среднее значение (в игре со случайными ходами).

Пусть нам известны значения a_ij выигрыша (или среднего выигрыша) при каждой паре стратегий. Значения a_ij можно записать в виде прямоугольной таблицы (матрицы), строки которой соответствуют нашим стратегиям (A_i), а столбцы — стратегиям противника (В_j). Такая таблица называется платежной матрицей или просто матрицей игры.

Матрица игры (платежная матрица) — таблица, в которой заданы стратегии игроков и платежи.

Матрица игры m´n имеет вид:

А В	B₁	B₂	…	B_n
A₁	a₁₁	a₁₂	…	a₁_n
A₂	a₂₁	a₂₂	…	a₂_n
…	…	…	…	…
A_m	a_m1	a_m2	…	a_mn

Сокращенно мы будем обозначать матрицу игры

Рассмотрим несколько элементарных примеров игр.

Пример 1. Два игрока А и В, не глядя друг на друга, кладут на стол по монете вверх гербом или вверх цифрой, по своему усмотрению. Если игроки выбрали одинаковые стороны (у обоих герб или у обоих цифра), то игрок А забирает обе монеты; иначе их забирает игрок В. Требуется проанализировать игру и составить ее матрицу.

Решение. Игра состоит только из двух ходов: наш ход и ход противника, оба личные. Игра не принадлежит к играм с полной информацией, так как в момент хода выполняющий его игрок не знает, что сделал другой.

Так как у каждого из игроков имеется только один личный ход, то стратегия игрока представляет собой выбор при этом единственном личном ходе.

У нас две стратегии: А₁ — выбирать герб и А₂ — выбирать цифру; у противника такие же две стратегии: В₁ герб и В₂ — цифра. Таким образом, данная игра есть игра 2´2. Будем считать выигрыш монеты за +1 . Матрица игры приведена ниже:

А В	B₁ _(Г)	B₂ _(Ц₎
A₁ _(Г₎		–1
A₂ _(Ц)	–1

На примере этой игры, как она ни элементарна, можно уяснить себе некоторые существенные идеи теории игр.

Предположим сначала, что данная игра выполняется только один раз. Тогда, очевидно, бессмысленно говорить о каких-либо "стратегиях" игроков более разумных, чем другие. Каждый из игроков с одинаковым основанием может принять любое решение. Однако при повторении игры положение меняется.

Действительно, допустим, что мы (игрок А) выбрали себе какую-то стратегию (скажем, А₁) и придерживаемся ее. Тогда уже по результатам первых нескольких ходов противник догадается о нашей стратегии и будет на нее отвечать наименее выгодным для нас образом, т.е. выбирать цифру. Нам явно невыгодно всегда применять какую-то одну стратегию; чтобы не оказаться в проигрыше, мы должны иногда выбирать герб, иногда — цифру. Однако, если мы будем чередовать гербы и цифры в какой-то определенной последовательности (например, через один), противник тоже может догадаться об этом иответить на эту стратегию наихудшим для нас образом. Очевидно, надежным способом, гарантирующим, что противник не будет знать нашей стратегии, будет такая организация выбора при каждом ходе, когда мы его сами наперед не знаем (это можно обеспечить, например, подбрасыванием монеты). Таким образом, мы путем интуитивных рассуждений подходим к одному из существенных понятий теории игр — к понятию "смешанной стратегии", т.е. такой, когда "чистые" стратегии — в данном случае А₁ и А₂ —чередуются случайно с определенными частотами. В данном примере из соображений симметрии заранее ясно, что стратегии А₁ и А₂ должны чередоваться с одинаковой частотой; в более сложных играх решение может быть далеко не тривиальным.

Пример 2. Игроки А и В одновременно и независимо друг от друга записывают каждый одно из трех чисел: 1, 2 или 3.

Если сумма написанных чисел четная, то В платит А эту сумму в тенге; если она нечетная, то, наоборот, А платит В эту сумму. Требуется проанализировать игру и составить ее матрицу.

Решение. Игра состоит из двух ходов; оба — личные. У нас (А) три стратегии: А₁ — писать 1; А₂ — писать 2; А₃ — писать 3. У противника (В) — те же три стратегии. Игра представляет собой игру 3´3 с матрицей, приведенной ниже

А В	B₁	B₂	B₃
A₁		–3
A₂	–3		–5
A₃		–5

Очевидно, как и в предыдущем случае, на любую выбранную нами стратегию противник может ответить наихудшим для нас образом. Действительно, если мы выберем, например, стратегию А₁ противник будет всегда отвечать на нее стратегией В₂; на стратегию А₂ — стратегией В₃; на стратегию А₃ — стратегией В₂. Таким образом, любой выбор определенной стратегии неизбежно приведет нас к проигрышу.

Пример 3. В нашем распоряжении имеются три вида вооружения: А₁_, А₂, А₃; у противника — три вида самолетов: B₁_, B₂, В₃. Наша задача — поразить самолет; задача противника — сохранить его непораженным. При применении вооружения А₁ самолеты B₁_, B₂, В₃ поражаются соответственно с вероятностями 0,9, 0,4 и 0,2; при вооружении А₂ — с вероятностями 0,3, 0,6 и 0,8; при вооружении А₃ — с вероятностями 0,5, 0,7 и 0,2. Требуется сформулировать ситуацию в терминах теории игр.

Решение. Ситуация может рассматриваться как игра 3´3 с двумя личными ходами и одним случайным. Наш личный ход — выбор типа вооружения; личный ход противника — выбор самолета для участия в бою. Случайный ход — применение вооружения; этот ход может закончиться поражением или непоражением самолета. Наш выигрыш равен единице, если самолет поражен, и равен нулю в противном случае. Нашими стратегиями являются три варианта вооружения; стратегиями противника — три варианта самолетов. Среднее значение выигрыша при каждой заданной паре стратегий есть не что иное, как вероятность поражения данного самолета данным оружием. Матрица игры приведена ниже:

А В	B₁	B₂	B₃
A₁	0,9	0,4	0,2
A₂	0,3	0,6	0,8
A₃	0,5	0,7	0,2

Оптимальной стратегией игрока в теории игр называется такая стратегия, которая при многократном повторении игры обеспечивает данному игроку максимально возможный средний выигрыш (или, что тоже самое, минимально возможный средний проигрыш). При выборе этой стратегии основой рассуждений является предположение, что противник является по меньшей мере таким же разумным, как и мы сами, и делает все для того, чтобы помешать нам добиться своей цели.

В теории игр все рекомендации вырабатывают, исходя именно из этих принципов; следовательно, в ней не учитываются элементы риска, неизбежно присутствующие в каждой реальной стратегии, а также возможные просчеты и ошибки каждого из игроков.

Теория игр, как и всякая математическая модель сложного явления, имеет свои ограничения. Важнейшим из них является то, что выигрыш искусственно сводится к одному единственному числу. В большинстве практических конфликтных ситуация при выработке разумной стратегии приходится принимать во внимание не один, а несколько численных параметров-критериев успешности мероприятия. Стратегия, являющаяся оптимальной по одному критерию, необязательно будет оптимальной по другим. Однако, сознавая эти ограничения и не придерживаясь слепо рекомендаций, получаемых игровыми методами, можно все же разумно использовать математический аппарат теории игр для выработки если не в точности "оптимальной", то, во всяком случае, "приемлемой" стратегии.