русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

Методы решения матричных игр


Дата добавления: 2015-08-31; просмотров: 1305; Нарушение авторских прав


Начнём с матричных игр, число стратегий хотя бы одного из игроков в которых равно двум.

Для построения решений 2 x n- и m x 2- игр существует эффективный метод, основанный на простых геометрических соображениях и, конечно на доказанных выше утверждениях. Этот метод называют наглядно-графическим.

2 х n – игры

Пусть

 

a11 a12 … a1n

a21 a22 … a2n

-матрица 2 х n- игры.

Согласно следствию из теоремы 2

V= (a1kp+a2k(1-p))

 

Поэтому отыскание значения игры и оптимального значения p* для игрока A равносильно определению значения p, при котором функция

(a1kp+a2k(1-p)), (*)

 

достигает своего максимального значения, которое равно v.

Опишем общую схему решения этой задачи, приводящую к искомому результату.

Максимум функции (*) проще всего найти, построив её график.

Для этого поступим следующим образом.

Предположим, что игрок A выбрал смешанную стратегию P={p, 1-p}, а игрок B – k-ю чистую стратегию 1k, k=1,2,…., n. Тогда средний выигрыш игрока A в ситуации {P, 1k} оказывается равным

(k) :w=a1kp+a2k(1-p).

На плоскости (p, w) это уравнение описывает прямую. Тем самым, каждой чистой стратегии игрока B будет соответствовать своя прямая.

Поэтому для построения графика функции (*) сначала на плоскости (p, w) последовательно и аккуратно рисуются все прямые

(k):w=a1kp+a2k(1-p), k=1,2,…,n

(Рис 1). Затем для каждого значения p в полосе 0≤p≤1 путём визуального сравнения соответствующих ему значений w на каждом из построенных прямых определяется и отмечается наименьшее(рис 2)


w w

 

 


 

1 0 1 P

0 P

 

рис. 1 Рис. 2

 

В результате описанной процедуры получается ломаная, которая и является графиком функции (*) (выделена жирным на рис 3). В рассматриваемой полосе эта ломаная как бы огибает снизу все семейство построенных прямых, и по этой причине её принято называть нижней огибающей.



Верхняя точка построенной нижней огибающей определяет и значение игры- v и оптимальную стратегию игрока А - P*={p*,1-p*} рис.

 

w w

 


 

 


0 1 P 0 P* 1 P

 

Рис. 3 Рис. 4

Опробуем описанную схему решения 2 x n-игры на конкретном примере.

Пример 4. Рассмотрим игру, заданную 2 x 6- матрицей

6 4 3 1 -1 0

-2 -1 1 0 5 4

 

Решение.

1-й шаг. Анализ игры на наличие Седловой точки. Нижнее значение игры равно -1, верхнее значение игры равно 1. Седловой точки нет. Решение игры нужно искать в смешанных стратегиях.

 

2-й шаг. Вычисление средних выигрышей игрока А (проводится при условии, что игрок В выбирает только чистые стратегии).

Из таблицы

P 6 4 3 1 -1 0

1-p -2 -1 1 0 5 4

легко получаем

(1): w=6p-2(1-p),

(2): w=4p - (1-p),

(3): w=3p +(1-p),

(4): w=p,

(5): w=-p+5(1-p),

(6): w=-p+4(1-p).

3-й шаг. Построение нижней огибающей.

 

 

Аккуратно строим на координатной плоскости (p,w) все шесть прямых, уравнения которых получены на 2-м шаге рис.5, и находим нижнюю огибающую.

 

 


W (1)

 


4 (2)

3 (3)

1 (4)

-1

-2 (6)

(5)

Рис. 5

Обращаем внимание читателя на то, что масштабы по осям p и w различны: в любой матричной игре ширина вертикальной полосы одна и та же (равна 1), в то время как w может принимать очень разные значения.

4-й шаг. Отыскание значения игры и оптимальной смешанной стратегии игрока А.

При аккуратном построении нижней огибающей нетрудно определить, точкой пересечения каких двух из посторонних шести прямых является её наивысшая точка. В данном случае это прямые (4) и (5), заданные уравнениями w=p и w=-p+5(1-p) соответственно. Решая систему уравнений

w=p,

w=-p+5(1-p),

получаем

p*=5/7, w*=5/7

 


w

 

 

 


1

0 P

 

Рис. 6

Тем самым, значение игры v и оптимальная стратегия P* игрока A найдены:

V= , P*= ,

Собственно, этим и заканчивается решение игры для игрока А , поскольку его в первую очередь интересует отыскание собственной оптимальной стратегии и ожидаемого наилучшего гарантированного среднего результата.

Замечание. Решающий матричную игру обычно отождествляет себя с одним из игроков ( как правило, это игрок А) , считая другого своим противником. Это связано ещё и с тем, что в некоторых случаях основное внимание уделяется поиску оптимальных стратегий только игрока А, а стратегии противника могут вообще не интересовать исследователя.

Вместе с тем, в целом ряде случаев оказывается важным знать оптимальные смешанные стратегии обоих игроков.

Покажем теперь, как зная оптимальную смешанную стратегию игрока А из примера 4, отыскать оптимальную смешанную стратегию игрока В и тем самым найти полное решение игры.

Прежде всего заметим, что для 1-й, 2-й, 3-й, и 6-й чистых стратегий игрока В выполняются неравенства

H(P*,1k)>v k=1, 2, 3, 6

(см. рис. 6).

Согласно следствию из теоремы 3, завершающему серию утверждений предыдущего раздела, соответствующие значения q*k в искомой оптимальной смешанной стратегии

Q*={q1*,q2*,q3*,q4*,q5*,q6*}

Игрока В должны быть равными нулю. Сказанное можно представить так:

q1*=0, q2*=0, q3*=0, q4*=q, q5*=1-q, q6*=0

 

 

из шести чистых стратегий игрока В выделены стратегии В4 и В5, соответствующие прямым (4) и (5), пересечение которых определяет наивысшую точку нижней огибающей).

Приравнивая любую из двух средних выигрышей игрока В (при условии, что игрок А выбирает только чистые стратегии), отвечающий предложенной смешанной стратегии

 

0 0 0 q 1-q 0

6 4 3 1 -1 0

-2 -1 1 0 5 4

 

К значению игры

q-1(1-q)= , 5(1-q)= ,

(В обоих случаях) получаем, что

q*=

 

Полное решение игры имеет следующий вид:

P*= , , Q*= 0,0,0, , ,0 , v= .

 

 

В зависимости от формы нижней огибающей, может представиться несколько возможностей.

A. Нижняя огибающая имеет ровно одну наивысшую точку (p*,w*).

1) 0<p*<1 и в наивысшей точке нижней огибающей пересекаются ровно две прямые. Тогда одна из этих прямых (к-я) имеет положительный наклон, а другая (l-я) – отрицательный (рис. 7), и оптимальная смешанная стратегия игрока В получается, если положить

qk*=q, q1*=1-q, qj*=0, j≠k, j≠l,

где q- решение уравнения

a1kq+a1l(1-q)=a2kq+a21(1-q)

2) 0<p*<1 и в наивысшей точке нижней огибающей пересекаются по меньшей мере три прямые. Выберем прямую с наибольшим положительным наклоном (к-ю) и прямую с наибольшим оптимальным наклоном (l-я). Каждая из этих прямых содержит звено нижней огибающей (рис. 7).

 

 

w w

 


(k) 1 0 1

P P

(l) (k) (l)

 

Рис. 7 Рис. 8

Оптимальная смешанная стратегия игрока В получается, если положить

qk*=q, q1*=1-q, qj*=0, j≠k, j≠l,

где q – решение уравнения

a1kq+a1l(1-q)=a2kq+a2l(1-q)

3) p*=0(оптимальная стратегия игрока А –это его чистая стратегия А2). Тогда игроку B выгодно применять чистую стратегию 1k , соответствующему номеру k* прямой, проходящей через точку (0, v) и имеющей наибольший отрицательный наклон (Рис. 9).

4) P*=1 (оптимальная стратегия игрока А – это его чистая стратегия Ai). Тогда оптимальная для игрока В является чистая стратегия 1k , соответствующая номеру k* прямой, проходящей через точку (1,v) и имеющей наибольший положительный наклон (Рис. 10).

 

w w

 

 


(k*) (k*)

 

0 1 1

P 0 P

 

 

Рис. 9 Рис. 10

 


w

 


(k*)

 

 

0 1

P

 

 

Рис. 11

 

 

B. Нижняя огибающая содержит горизонтальный участок, соответствующий чистой стратегии 1k. Игрока В, которая и является оптимальной для него (Рис. 11)

Замечание. Ситуацию с наличием лишь двух конкурирующих стратегий игрока А нельзя считать надуманной. Она возникает сравнительно часто. Например, в случае, если нужно сравнить два образца некоторого изделия (скажем, старого и модернизированного) с целью выяснения возможности замены, это весьма удобно сделать при помощи матрицы 2 х n- игры.

 

m x 2- игры

Пусть теперь в матричной игре две чистые стратегии имеет игрок В, а число чистых стратегий у игрока А произвольно (равно m).

Это означает, что матрицы игры имеет вид

a11 a12

a21 a22

. .

. .

. .

am1 am2

Есть два способа решения этой игры:

1) Путем применения рассуждений, во многом напоминающих те, что описаны для 2 х n- игры,

2) Путем непосредственного сведения к 2 х n – игре.

Способ 1-й. Пусть Q ={q, 1-q} – произвольная смешанная стратегия игрока B. Если игрок А выбирает i-ю чистую стратегию, i=1,2…,m, то средний выигрыш игрока В в ситуации {1i ,Q} будет равен

(i):w= a1iq+ai2(1-q), i=1,2,….,m.(*)

Зависимость этого выигрыша от переменной q описывается прямой.

График функции

(ai1q+ai2 (1-q))

 

Является верхняя огибающая семейства прямых (*) в полосе 0≤q≤1, соответствующих чистым стратегиями игрока А (Рис. 12)

 

Абсциссой нижней точки полученной ломаной будет значение q*, определяющее оптимальную смешанную стратегию игрока B, а ординатой v –значение игры.

Замечание. Отыскание оптимальной смешанной w

стратегии игрока А проводится по той же схеме,

которая позволяет находить оптимальную

смешанную стратегию игрока B в 2 х n – игре.

 

v

 

q* 1 q

 

Рис. 12

 

Способ 2-й. Рассмотрим 2 х m – игру с матрицей Ầ, которая получается из матрицы A m x 2 - игры

путём транспонирования и замены всех элементов на противоположные:

ik=-aik , i=1,…,m; k=1,…,n.

Игрока Ầ в этой новой игре имеет все те же интересы, что и игрок B в исходной игре, а интересы игрока B полностью совпадают с интересами игрока А исходной игры. Найденные стратегии игроков Ầ и B᷉ суть

Стратегий игроков B и А соответственно. Что касается значения ṽ новой игры, то оно противоположно значению v исходной игры,

ṽ=-v

m x n –игры

В принципе решение любой матричной игры сводится к решению стандартной задачи линейного программирования и, тем самым, может быть найдено соответствующими методами. При этом требуемый объём вычислений напрямую зависит от числа чистых стратегий игроков (растет с его увеличением и, значит, с увеличением размеров матрицы А игры). Поэтому любые приемы предварительного анализа игры, позволяющие уменьшать размеры матрицы игры или еще как-то упрощать эту матрицу,не нанося непоправимого ущерба решению, играют на практике весьма важную роль.

 



<== предыдущая лекция | следующая лекция ==>
Обратите внимание, что переменные z и Z являются разными. | Алгоритм розрахунку методом розрахунку вагових коефіцієнтів на основі попарного порівняння об’єктів-аналогів.


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 0.314 сек.