В экономической практике нередко приходится принимать решения, выбирать стратегии не имея информации о возможном сопернике в условиях неопределенности и риска. Для описания таких ситуаций разрабатывается математический аппарат игр с "природой". "Природа" в теории игр — объективная действительность, некая незаинтересованная сторона, "поведение" которой неизвестно, но, во всяком случае, не содержит элемента сознательного противодействия нашим планам.
Формально изучение игр с "природой", так же как и стратегических, должно начинаться с построения платежной матрицы, что является, по существу, наиболее трудоемким этапом подготовки принятия решения. Ошибки в платежной матрице не могут быть компенсированы никакими вычислительными методами и приведут к неверному итоговому результату.
Отличительная особенность игры с природой состоит в том, что в ней сознательно действует только один из участников, в большинстве случаев называемый игроком 1. Игрок 2 (природа) сознательно против игрока 1 не действует, а выступает как не имеющий конкретной цели и случайным образом выбирающий очередные "ходы" партнер по игре. Поэтому термин "природа" характеризует некую объективную действительность, которую не следует понимать буквально, хотя вполне могут встретиться ситуации, в которых "игроком" 2 действительно может быть природа (например, обстоятельства, связанные с погодными условиями или с природными стихийными силами).
На примере игры с природой рассмотрим проблему заготовки угля на зиму.
Необходимо закупить уголь для обогрева дома. Количество хранимого угля ограничено, и в течение холодного периода должно быть полностью израсходовано. Предполагается, что неизрасходованный зимой уголь летом пропадает. Покупать уголь можно в любое время, однако летом он дешевле, чем зимой. Неопределенность состоит в том, что неизвестно, какой будет зима суровой, тогда придется докупать уголь, или мягкой, тогда часть угля может остаться неиспользованной. Очевидно, что у природы нет злого умысла и она ничего против человека "не имеет". С другой стороны, долгосрочные прогнозы, составляемые метеорологическими службами, неточны и поэтому могут использоваться в практической деятельности только как ориентировочные при принятии решений
Решение. Матрица игры с природой аналогична матрице стратегической игры где aij — выигрыш игрока 1 при реализации его чистой стратегии i и чистой стратегии j игрока 2 (i=1,..., m, j = 1,...,n).
На первый взгляд отсутствие обдуманного противодействия упрощает игроку задачу выбора решения. Однако, хотя лицу, принимающему решение (ЛПР) никто не мешает, ему труднее обосновать свой выбор, поскольку в этом случае гарантированный результат не известен.
Методы принятия решений в играх с природой зависят от характера неопределенности, точнее от того, известны или нет вероятности состояний (стратегий) природы, т.е. имеет ли место ситуация риска или неопределенности.
Рассмотрим организацию и аналитическое представление игры с природой. Пусть игрок 1 имеет m возможных стратегий:А1, А2,…, Аm, а у природы имеется n возможных состояний (стратегий): П1,П2,..., Пn, тогда условия игры с природой задаются матрицей А выигрышей игрока 1:
Платит, естественно, не природа, а некая третья сторона (или совокупность сторон, влияющих на принятие решений игроком 1 и объединенных в понятие "природа").
Возможен и другой способ задания матрицы игры с природой, не в виде матрицы выигрышей, а в виде так называемой матрицы рисков R = или матрицы упущенных возможностей. Величина риска — это размер платы за отсутствие информации о состоянии среды. Матрица R может быть построена непосредственно из условий задачи или на основе матрицы выигрышей А.
Риск игрока — разность между выигрышем, который он получил бы, если бы знал состояние "природы", и выигрышем, который он получит в тех же условиях, применяя ту или иную стратегию. Матрица рисков — таблица, в которой заданы стратегии игрока, состояния "природы" и риски при всех возможных сочетаниях стратегий и состояний "природы"
Зная состояние природы (стратегию) Пj, игрок выбирает ту стратегию, при которой его выигрыш максимальный, те rij = bj – aij, где bj = max aijпри заданном j. Например, для матрицы выигрышей:
(5.11)
b1=4, b2=8, b3=6, b4=9.
Согласно введенным определениям rij и bj получаем матрицу рисков:
(5.12)
Независимо от вида матрицы игры требуется выбрать такую стратегию игрока (чистую или смешанную, если последняя имеет смысл), которая была бы наиболее выгодной по сравнению с другими. Необходимо отметить, что в игре с природой понятие смешанной стратегии игрока не всегда правомерно, поскольку его действия могут быть альтернативными, т.е. выбор одной из стратегий отвергает все другие стратегии (например, выбор альтернативных проектов)
Неопределенность, связанную с отсутствием информации о вероятностях состояний среды (природы), называют "безнадежной" или "дурной".
В таких случаях для определения наилучших решений используются следующие критерии — максимакса, Вальда, Сэвиджа, Гурвица.
Применение каждого из перечисленных критериев проиллюстрируем на примере матрицы выигрышей (5.11) или связанной с ней матрицы рисков (5.12).
Критерий максимакса. С его помощью определяется стратегия, максимизирующая максимальные выигрыши для каждого состояния природы. Это критерий крайнего оптимизма Наилучшим признается решение, при котором достигается максимальный выигрыш, равный
M=max max aij.
Нетрудно увидеть, что для матрицы А наилучшим решением будет A1, при котором достигается максимальный выигрыш — 9.
Следует отметить, что ситуации, требующие применения такого критерия, в экономике в общем нередки, и пользуются им не только безоглядные оптимисты, но и игроки, поставленные в безвыходное положение, когда они вынуждены руководствоваться принципом "или пан, или пропал".
Максиминный критерий Вальда. С позиций данного критерия природа рассматривается как агрессивно настроенный и сознательно действующий противник типа тех, которые противодействуют в стратегических играх. Выбирается решение, для которого достигается значение W = max min aij.
Для платежной матрицы А (5.11) нетрудно рассчитать:
- для первой стратегии (i = 1) min aij = 1;
- для второй стратегии (i = 2) min aij = 3;
- для третьей стратегии (j = 3) min aij = 2.
Тогда W = max min aij= 3, что соответствует второй стратегии А2 игрока 1.
В соответствии с критерием Вальда, из всех самых неудачных результатов выбирается лучший (W = 3).
Максиминный критерий Вальда — оптимальная стратегия игрока, при которой минимальный выигрыш максимален, т.е. стратегия, гарантирующая при любых условиях выигрыш, не меньший, чем нижняя цена игры.
Это перестраховочная позиция крайнего пессимизма, рассчитанная на худший случай. Такая стратегия приемлема, например, когда игрок не столь заинтересован в крупной удаче, но хочет себя застраховать от неожиданных проигрышей. Выбор такой стратегии определяется отношением игрока к риску.
Критерий минимаксного риска Сэвиджа Выбор стратегии аналогичен выбору стратегии по принципу Вальда с тем отличием, что игрок руководствуется не матрицей выигрышей А (5.11), а матрицей рисков R (5.12):
S=min max rij.
Для матрицы R (5.12) нетрудно рассчитать:
- для первой стратегии (i = 1) max rij= 4;
- для второй стратегии (i = 2) max rij = 6;
- для третьей стратегии (i = 3) max rij = 7.
Минимально возможный из самых крупных рисков, равный 4, достигается при использовании первой стратегии А1.
Критерий минимаксного риска Сэвиджа — рекомендация выбора той стратегии, при которой величина риска принимает наименьшее значение в самой неблагоприятной ситуации.
Критерий оптимизма-пессимизма Гурвица. Критерий оптимизма-пессимизма Гурвица — рекомендация при выборе решения в условиях неопределенности не руководствоваться ни крайним пессимизмом, ни крайним оптимизмом. Крайние оценки учитываются с коэффициентом, выбираемым между нулем и единицей.
Этот критерий при выборе решения рекомендует руководствоваться некоторым средним результатом, характеризующим состояние между крайним пессимизмом и безудержным оптимизмом. Согласно этому критерию стратегия в матрице А выбирается в соответствии со значением:
НА = max{р min aij+(1–р) max aij},
где р — коэффициент пессимизма (0 < р £ 1).
При р = 0 критерий Гурвица совпадает с максимаксным критерием, а при р = 1 — с критерием Вальда. Покажем процедуру применения данного критерия для матрицы А (5.11) при р = 0,5.
- для первой стратегии
(i=1) 0,5(min aij+maxaij)=0,5(1+9)=5;
- для второй стратегии
(i=2) 0,5(min aij+maxaij)=0,5(3+8)=5,5;
- для третьей стратегии
(i=3) 0,5(min aij+maxaij)=0,5(2+6)=4.
Тогда НА = max {0,5(minaij – maxaij)} = 5,5, т.е. оптимальной является вторая стратегия А2.
Применительно к матрице рисков R критерий пессимизма-оптимизма Гурвица имеет вид:
НА = min{р max rij+(1–р) min rij}.
При р = 0 выбор стратегии игрока 1 осуществляется по условию наименьшего из всех возможных рисков (min rtj); при р = 1 — по критерию минимаксного риска Сэвиджа.
В случае, когда по принятому критерию рекомендуется к использованию несколько стратегий, выбор между ними может делаться по дополнительному критерию, например в расчет могут приниматься средние квадратичные отклонения от средних выигрышей при каждой стратегии. Здесь стандартного подхода нет. Выбор может зависеть от склонности к риску ЛПР.
Результаты применения рассмотренных выше критериев приведены в следующей матрицы выигрышей:
Для игрока 1 лучшими являются стратегии:
- по критерию Вальда — А3,
- по критерию Сэвиджа — А2 и А3,
- по критерию Гурвица (при р = 0,6) — А3,
- по критерию максимакса — А4.
Поскольку стратегия А3 фигурирует в качестве оптимальной по трем критериям выбора из четырех испытанных, степень ее надежности можно признать достаточно высокой для того, чтобы рекомендовать эту стратегию к практическому применению.
Таким образом, в случае отсутствия информации о вероятностях состояний среды теория не дает однозначных и математически строгих рекомендаций по выбору критериев принятия решений. Это объясняется в большей мере не слабостью теории, а неопределенностью самой ситуации. Единственный разумный выход в подобных случаях —попытаться получить дополнительную информацию, например, путем проведения исследований или экспериментов. При отсутствии дополнительной информации принимаемые решения теоретически недостаточно обоснованы и в значительной мере субъективны. Хотя применение математических методов в играх с природой не дает абсолютно достоверного результата и последний в определенной степени является субъективным (вследствие произвольности выбора критерия принятия решения), оно тем не менее создает некоторое упорядочение имеющихся в распоряжении ЛПР данных: задается множество состояний природы, альтернативные решения, выигрыши и потери при различных сочетаниях состояния "среда — решение". Такое упорядочение представлений о проблеме само по себе способствует повышению качества принимаемых решений.
Контрольные вопросы и упражнения
1. Какие ситуации являются предметом изучения теории игр?
2. Что называется игрой?
3. Какая игра называется парной и какая множественной?
4. Что понимается под партией?
5. Что такое ход и стратегия?
6. Чем отличается личный ход от случайного?
7. Какая игра является игрой с полной и неполной информацией? Приведите примеры.
8. Опишите одноходовую игру двух лиц с нулевой суммой?
9. Что означает решить задачу?
10. Какая стратегия называется оптимальной?
11. Что такое цена игры?
12. Каким принципом лучше всего руководствоваться при выборе оптимальных стратегий?
13. Как определить нижнюю и верхнюю цены и какое соотношение существует между ними?
14. Что называется седловой точкой платежной матрицы?
15. Что такое смешанная стратегия?
16. Какие чистые стратегии называются активными?
17. Как решаются игры, не имеющие седловой точки?
18. Упростите игру, представленную в таблице 26.
19. Решите игру, представленную в таблице 27.
Таблица 26
Bj Ai
B1
B2
B3
B4
B5
A1A2A3A4A5
Таблица 27
Bj Ai
B1
B2
B3
B4
A1A2A3
-2
20. Определить нижнюю и верхнюю цены для игр, заданных платежными матрицами. ; .
21. Найти графически решение игры, заданной матрицей .
22. Найти решение игры заданной матрицей .
23. Найти решение игры, заданной матрицей А, сведя ее к задаче линейного программирования. .
24. Определите критерии оценок состояния природы Лапласа, Бейеса-Лапласа, Вельда, Сэвиджа, Гурвица для матрицы А и проведя анализ этих оценок, найдите доминирующий вариант выбора стратегии в игре с природой. .