русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

Конфликтные ситуации.


Дата добавления: 2015-06-12; просмотров: 1173; Нарушение авторских прав


Наиболее простыми из ситуаций, содержащих «плохую» неопределенность, являются так называемые конфликтные ситуации. Так называются ситуации, в которых сталкиваются интересы двух (или более) сторон, преследующих разные (иногда противоположные) цели, причем выигрыш каждой стороны зависит от того, как себя поведут другие.

Примеры конфликтных ситуаций многообразны. К ним, безусловно, принадлежит любая ситуация, складывающаяся в ходе боевых действий, ряд ситуаций в области экономики. Столкновение противоречащих друг другу интересов наблюдается также в судопроизводстве, в спорте, видовой борьбе. В какой-то мере противоречивыми являются также взаимоотношения различных ступеней иерархии в сложных системах. В некотором смысле «конфликтной» можно считать и ситуацию с несколькими критериями: каждый из них предъявляет к управлению свои требования и, как правило, эти требования противоречивы.

В теории игр разработана математическая теория конфликтных ситуаций. Ее цель – разработка рекомендаций по оптимальному поведению участников конфликта.

Каждая непосредственно взятая из практики конфликтная ситуация очень сложна, и ее анализ затруднен наличием привходящих, несущественных факторов. Чтобы сделать возможным математический анализ конфликта, строится его математическая модель. Такую модель называют игрой. Игра ведется по определенным правилам. Эти правила указывают «права и обязанности» участников, а также исход игры – выигрыш или проигрыш каждого участника в зависимости от сложившейся обстановки.

Человечество издавна пользуется такими формализованными моделями конфликтов – «играми» в буквальном смысле слова (шашки, шахматы, карточные игры и т.п.). Отсюда и название «теории игр», и ее терминология: конфликтные стороны условно называются «игроками», одно осуществление игры – «партией», исход игры – «выигрышем» или «проигрышем». Будем считать, что выигрыши (проигрыши) участников имеют количественное выражение (если это не так, то всегда можно им его приписать, например, в шахматах считать «выигрыш» за единицу, «проигрыш» - за минус единицу, «ничью» - за нуль).



Развитие игры во времени можно представлять как ряд последовательных «ходов» участников (в простейшем варианте – один ход). Ходом называется выбор игроком одного из предусмотренных правилами игры действий и его осуществление. Ходы бывают личные и случайные. При личном ходе игрок сознательно выбирает и осуществляет тот или другой вариант действий (пример – любой ход в шахматах). При случайном ходе выбор осуществляется не только волей игрока, но также каким-то механизмом случайного выбора («бросание монеты» с оптимально подобранной вероятностью и т.д.).

Теоретически дело не изменится, если предположить, что все эти решения приняты игроком заранее. Это будет значить, что игрок выбрал определенную стратегию. Стратегия бывает чистой и смешанной. Чистая стратегия состоит только из личных ходов, смешанная включает случайные ходы. Выбор стратегии означает, что игрок может и не участвовать в игре лично, а передать алгоритм выбора своих ходов незаинтересованному лицу. Стратегия, например, может быть задана машине-автомату в виде программы (именно так играют в шахматы ЭВМ).

Игра называется игрой с нулевой суммой, если сумма выигрышей всех игроков равна нулю (то есть каждый игрок выигрывает только за счет других). Самый простой случай – парная игра с нулевой суммой – называется антагонистической (или игрой со строгим соперничеством). Теория антагонистических игр – наиболее развитый раздел теории игр, с четкими рекомендациями. Ниже мы познакомимся с некоторыми ее понятиями и приемами.

Теория игр, как и всякая математическая модель, имеет свои ограничения. Одним из них является предположение о полной («идеальной») разумности противника. В реальном конфликте зачастую оптимальная стратегия состоит в том, чтобы угадать, в чем противник «глуп», и воспользоваться этой глупостью в свою пользу. Схемы теории игр не включают элементов риска, неизбежно сопровождающего разумные решения в реальных конфликтах. В теории игр чаще выявляется наиболее осторожное, «перестраховочное» поведение участников конфликта. Сознавая эти ограничения и, поэтому, не придерживаясь слепо рекомендаций, полученных игровыми методами, можно все же разумно использовать аппарат теории игр как «совещательный» при выборе решения.

Рассмотрим числовой пример игры с нулевой суммой. Предполагается, что результатом игры является плата, которую в соответствии с правилами проигравший платит выигравшему. Ради простоты ограничимся рассмотрением одноходовых игр, в которых участвуют два игрока А и В, причем проигрыш одного, например, В, равен выигрышу другого, то есть А. Для того чтобы полностью определить такую игру, нужно задать таблицу платежей – платежную матрицу. Поясним это на примере. Пусть задана следующая платежная матрица (таблица).

 

Игроки В
    ход 1 ход 2 ход 3 ход 4
ход 1
А ход 2 -2
  ход 3 -1

 

Матрица известна обоим игрокам. Игрок А должен выбрать одну из строк матрицы (ход). Игрок В, не зная результата его выбора, должен выбрать один из столбцов. Число, стоящее на пересечении выбранных ими строки и столбца, определяет выигрыш игрока А. Выигрыш игрока В равен этому же числу с обратным знаком. Например, если А выбрал вторую строку, а В – третий столбец, то А выигрывает, а В проигрывает 5 единиц. Будем считать, что игроки осторожны и целью каждого из них является максимизация наименьшего возможного (гарантированного) выигрыша.

Основной вопрос, который возникает в теории игр, состоит в следующем: существует ли наилучший способ игры для каждого из игроков, то есть, имеются ли у них оптимальные стратегии? Сразу видно, что игроку А выгоднее всего выбирать ход 1, так как элементы первой строки соответственно больше элементов второй и третьей строк. Точно также игроку В выгоднее всего выбирать ход 2, так как элементы второго столбца соответственно меньше элементов остальных столбцов.

В теории игр доказано следующее правило. Если наибольший из минимальных выигрышей для А в точности равен наименьшему из возможных максимальных проигрышей для В, то есть если минимум в какой-нибудь строке платежной матрицы совпадает с максимумом в соответствующем столбце, то эти строка и столбец являются оптимальными чистыми стратегиями игроков. Точка их пересечения называется седловой точкой платежной матрицы. В последнем примере седловой точкой является число 4.

Следовательно, благодаря специфическому свойству данной платежной матрицы – наличию в ней седловой точки, найдены оптимальные чистые стратегии игроков А – всегда выбирать ход 1, В – ход 2. Число 4 в этом случае носит название цены игры. Смысл этого термина такой: цена игры – это та плата, которую получает оптимально играющий игрок, играя с другим оптимально играющим игроком. Ясно, что ход 1 игрока А обеспечивает ему выигрыш не менее 4, а ход 2 игрока В гарантирует ему проигрыш не более 4 (игроки А и В не обязательно равноправны).

Но далеко не каждая платежная матрица имеет седловую точку. Например, матрица

 

-1
-1

 

седловой точки не имеет. Как же находить оптимальные стратегии игрокам, если платежные матрицы не обладают приведенными выше свойствами?

В теории игр доказано, что в этих случаях залог успеха при многократной игре с одной и той же матрицей состоит в выборе своих ходов с определенными частотами (смешанные стратегии). То есть для всякой игры с нулевой суммой всегда существуют оптимальные смешанные стратегии. Их подбор – это подбор частот использования нескольких разных ходов. Если игра проводится один раз, то лучше всего для игрока избрать ход, пользуясь найденными частотами случайного их выбора. Чтобы сделать эти рассуждения до конца понятными, обратимся к задаче.

Рассмотрим пример игры без седловой точки и приведем (без доказательства) ее решение. Игра состоит в следующем: два игрока А и В одновременно и не сговариваясь показывают один, два или три пальца. Выигрыш решает общее количество пальцев: если оно четное, выигрывает А и получает у В сумму, равную этому числу; если нечетное, то наоборот, А платит В сумму, равную этому числу. Как поступать игрокам?

Составим матрицу игры. В одной партии у каждого игрока три возможных хода: показать один, два или три пальца. Матрица 3 х 3 представлена в таблице. В дополнительном правом столбце приведены минимумы строк, а в дополнительной нижней строке – максимумы столбцов. Седловой точки нет.

 

Игроки Игрок В
1 палец 2 пальца 3 пальца α
  1 палец -3 -3
Игрок А 2 пальца -3 -5 -5
  3 пальца -5 -5
  β  

 

Нижняя цена игры α=-3 и соответствует чистой стратегии А – один палец. Это значит, что при осторожном его поведении мы гарантируем, что он не проиграет больше, чем 3. Положение противника кажется еще хуже: нижняя цена игры β=4, то есть при осторожном поведении игрок В проиграет не более 4. В общем, положение не слишком хорошее – ни для той, ни для другой стороны. Нельзя ли его улучшить? Оказывается можно.

Если каждая сторона будет применять не одну какую-то чистую стратегию, а смешанную, в которою первый и третий ходы выбирают с вероятностями ¼, а второй – с вероятностью ½, то есть

РА=(1/4, 1/2,1/4), РВ=(1/4, 1/2,1/4),

то средний выигрыш будет устойчиво равен нулю (значит, игра «справедлива» и одинаково выгодна той и другой стороне). Стратегии РА, РВ образуют оптимальное решение игры, а ее цена =0.

Еще один игровой пример, но уже со схемой решения – задача о встречах.

Саша и Лиза условились встречаться зимой возле кинотеатра. Если Саша придет раньше назначенного времени, то Лизы еще не будет и ему придется мерзнуть. Потери Саши в этом случае можно оценить числом –1. Если раньше придет Лиза, то ему будет еще хуже: потери равны –4. В том случае, когда оба приходят одновременно (поздно или рано), потерь нет ни у кого.

Как быть Саше и Лизе? Считая, что перед нами игра двух лиц с нулевой суммой, прежде всего, составим платежную матрицу (таблица):

 

    Лиза
    Прийти рано Прийти поздно
Саша Прийти рано –1
  Прийти поздно –4

 

Будем искать оптимальные стратегии участников при многократных встречах. Сначала проверим, нет ли у матрицы седловых точек. Оказывается, что нет. (Минимум в каждой строке отрицателен, а максимумы в столбцах равны 0). Значит, наверняка существуют оптимальные смешанные стратегии для каждого из них.

Пусть Саша выбирает ход «прийти рано» с частотой х, а ход «прийти поздно» – с частотой 1х. Аналогично для двух ходов Лизы обозначим частоты ее выбора через у и 1у. Средний выигрыш, который получит Саша при многократных свиданиях, составляет: W(х,у) =–4·у·(1–х) +(–1)·х·(1–у) + 0·х·у + 0·(1–х)·(1–у) = 5·х·ух-4·у. Тогда средний выигрыш Лизы составит: –W(х,у) = –5ху+х+4у. Величину х Саше нужно подобрать так, чтобы выигрыш W(х,у) достиг максимума. Аналогично Лизе – подобрать у, чтобы –W(x,y) был максимален. Вычисляем производную функции W по х и приравнивая ее нулю получаем: 5у–1 = 0. Производную –W по у также приравниваем нулю: 5х–4 = 0. Отсюда можно найти х и у.

Ответ: х = 4/5, у = 1/5. Полученный результат объясняется так: Саша должен приходить к кинотеатру в четырех случаях из пяти раньше назначенного времени, то есть каждый раз случайно именно с этими вероятностями принимать решение. Лиза же, наоборот, в четырех случаях из пяти должна опаздывать. Оптимальные смешанные стратегии найдены. Тогда ее средний выигрыш составит –W = -5·4/5·1/5 + 4/5 + 4·1/5 = 4/5. Любое отклонение от смешанной стратегии для Лизы приведет к снижению ее среднего выигрыша (снижение проигрыша для Саши). Аналогичны вредные последствия отклонения от своей смешанной стратегии для Саши.

 



<== предыдущая лекция | следующая лекция ==>
Теория игр. | Игры с природой.


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 0.007 сек.