русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

Платежная матрица


Дата добавления: 2015-07-09; просмотров: 3997; Нарушение авторских прав


 

 

В зависимости от числа возможных стратегий игры делятся на "конечные" и "бесконечные".

Конечной называется игра, в которой у каждого игрока имеется только конечное число стратегий.

Конечная игра, в которой игрок А имеет m стратегий, а игрок В n стратегий, называется игрой m´n.

Рассмотрим игру m´n двух игроков А и В ("мы" и "противник").

Будем обозначать наши стратегии A1, А2,…, Аm; стратегии противника — B1, В2,..., Вn.

Пусть каждая сторона выбрала определенную стратегию; для нас это будет Аi для противника. Вj.

Если игра состоит только из личных ходов, то выбор стратегий Ai, Вj однозначно определяет исход игры — наш выигрыш. Обозначим его aij.

Если игра содержит, кроме личных, случайные ходы, то выигрыш при паре стратегий Аi, Вj есть величина случайная, зависящая от исходов всех случайных ходов. В этом случае естественной оценкой ожидаемого выигрыша является его среднее значение (математическое ожидание). Мы будем обозначать одним и тем же знаком aij как сам выигрыш (в игре без случайных ходов), так и его среднее значение (в игре со случайными ходами).

Пусть нам известны значения aij выигрыша (или среднего выигрыша) при каждой паре стратегий. Значения aij можно записать в виде прямоугольной таблицы (матрицы), строки которой соответствуют нашим стратегиям (Ai), а столбцы — стратегиям противника (Вj). Такая таблица называется платежной матрицей или просто матрицей игры.

Матрица игры (платежная матрица) — таблица, в которой заданы стратегии игроков и платежи.

 


Матрица игры m´n имеет вид:

 

А В B1 B2 Bn
A1 a11 a12 a1n
A2 a21 a22 a2n
Am am1 am2 amn

 



Сокращенно мы будем обозначать матрицу игры

Рассмотрим несколько элементарных примеров игр.

Пример 1. Два игрока А и В, не глядя друг на друга, кладут на стол по монете вверх гербом или вверх цифрой, по своему усмотрению. Если игроки выбрали одинаковые стороны (у обоих герб или у обоих цифра), то игрок А забирает обе монеты; иначе их забирает игрок В. Требуется проанализировать игру и составить ее матрицу.

Решение. Игра состоит только из двух ходов: наш ход и ход противника, оба личные. Игра не принадлежит к играм с полной информацией, так как в момент хода выполняющий его игрок не знает, что сделал другой.

Так как у каждого из игроков имеется только один личный ход, то стратегия игрока представляет собой выбор при этом единственном личном ходе.

У нас две стратегии: А1 — выбирать герб и А2 — выбирать цифру; у противника такие же две стратегии: В1 герб и В2 — цифра. Таким образом, данная игра есть игра 2´2. Будем считать выигрыш монеты за +1 . Матрица игры приведена ниже:

 

А В B1 (Г) B2 )
A1 ) –1
A2 (Ц) –1

 

На примере этой игры, как она ни элементарна, можно уяснить себе некоторые существенные идеи теории игр.

Предположим сначала, что данная игра выполняется только один раз. Тогда, очевидно, бессмысленно говорить о каких-либо "стратегиях" игроков более разумных, чем другие. Каждый из игроков с одинаковым основанием может принять любое решение. Однако при повторении игры положение меняется.

Действительно, допустим, что мы (игрок А) выбрали себе какую-то стратегию (скажем, А1) и придерживаемся ее. Тогда уже по результатам первых нескольких ходов противник догадается о нашей стратегии и будет на нее отвечать наименее выгодным для нас образом, т.е. выбирать цифру. Нам явно невыгодно всегда применять какую-то одну стратегию; чтобы не оказаться в проигрыше, мы должны иногда выбирать герб, иногда — цифру. Однако, если мы будем чередовать гербы и цифры в какой-то определенной последовательности (например, через один), противник тоже может догадаться об этом иответить на эту стратегию наихудшим для нас образом. Очевидно, надежным способом, гарантирующим, что противник не будет знать нашей стратегии, будет такая организация выбора при каждом ходе, когда мы его сами наперед не знаем (это можно обеспечить, например, подбрасыванием монеты). Таким образом, мы путем интуитивных рассуждений подходим к одному из существенных понятий теории игр — к понятию "смешанной стратегии", т.е. такой, когда "чистые" стратегии — в данном случае А1 и А2 —чередуются случайно с определенными частотами. В данном примере из соображений симметрии заранее ясно, что стратегии А1 и А2 должны чередоваться с одинаковой частотой; в более сложных играх решение может быть далеко не тривиальным.

Пример 2. Игроки А и В одновременно и независимо друг от друга записывают каждый одно из трех чисел: 1, 2 или 3.

Если сумма написанных чисел четная, то В платит А эту сумму в тенге; если она нечетная, то, наоборот, А платит В эту сумму. Требуется проанализировать игру и составить ее матрицу.

Решение. Игра состоит из двух ходов; оба — личные. У нас (А) три стратегии: А1 — писать 1; А2 — писать 2; А3 — писать 3. У противника (В) — те же три стратегии. Игра представляет собой игру 3´3 с матрицей, приведенной ниже

 

А В B1 B2 B3
A1 –3
A2 –3 –5
A3 –5

 

Очевидно, как и в предыдущем случае, на любую выбранную нами стратегию противник может ответить наихудшим для нас образом. Действительно, если мы выберем, например, стратегию А1 противник будет всегда отвечать на нее стратегией В2; на стратегию А2 — стратегией В3; на стратегию А3 — стратегией В2. Таким образом, любой выбор определенной стратегии неизбежно приведет нас к проигрышу.

Пример 3. В нашем распоряжении имеются три вида вооружения: А1, А2, А3; у противника — три вида самолетов: B1, B2, В3. Наша задача — поразить самолет; задача противника — сохранить его непораженным. При применении вооружения А1 самолеты B1, B2, В3 поражаются соответственно с вероятностями 0,9, 0,4 и 0,2; при вооружении А2 — с вероятностями 0,3, 0,6 и 0,8; при вооружении А3 — с вероятностями 0,5, 0,7 и 0,2. Требуется сформулировать ситуацию в терминах теории игр.

Решение. Ситуация может рассматриваться как игра 3´3 с двумя личными ходами и одним случайным. Наш личный ход — выбор типа вооружения; личный ход противника — выбор самолета для участия в бою. Случайный ход — применение вооружения; этот ход может закончиться поражением или непоражением самолета. Наш выигрыш равен единице, если самолет поражен, и равен нулю в противном случае. Нашими стратегиями являются три варианта вооружения; стратегиями противника — три варианта самолетов. Среднее значение выигрыша при каждой заданной паре стратегий есть не что иное, как вероятность поражения данного самолета данным оружием. Матрица игры приведена ниже:

 

А В B1 B2 B3
A1 0,9 0,4 0,2
A2 0,3 0,6 0,8
A3 0,5 0,7 0,2

 

Оптимальной стратегией игрока в теории игр называется такая стратегия, которая при многократном повторении игры обеспечивает данному игроку максимально возможный средний выигрыш (или, что тоже самое, минимально возможный средний проигрыш). При выборе этой стратегии основой рассуждений является предположение, что противник является по меньшей мере таким же разумным, как и мы сами, и делает все для того, чтобы помешать нам добиться своей цели.

В теории игр все рекомендации вырабатывают, исходя именно из этих принципов; следовательно, в ней не учитываются элементы риска, неизбежно присутствующие в каждой реальной стратегии, а также возможные просчеты и ошибки каждого из игроков.

Теория игр, как и всякая математическая модель сложного явления, имеет свои ограничения. Важнейшим из них является то, что выигрыш искусственно сводится к одному единственному числу. В большинстве практических конфликтных ситуация при выработке разумной стратегии приходится принимать во внимание не один, а несколько численных параметров-критериев успешности мероприятия. Стратегия, являющаяся оптимальной по одному критерию, необязательно будет оптимальной по другим. Однако, сознавая эти ограничения и не придерживаясь слепо рекомендаций, получаемых игровыми методами, можно все же разумно использовать математический аппарат теории игр для выработки если не в точности "оптимальной", то, во всяком случае, "приемлемой" стратегии.

 

 



<== предыдущая лекция | следующая лекция ==>
Понятие об игровых моделях | Нижняя и верхняя цена игры


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 1.048 сек.