ã, 2000, Александр Ермолин,
кандидат физико-математических наук, г.Петрозаводск
Ключевые слова:
теория игр, моделирование математическое, компьютерные игры, оценка динамичности
Играют не только дети. Игр в нашей жизни так много, а сами они столь разнообразны и увлекательны, что мы просто не в состоянии оставаться в стороне: играем сами, болеем за других игроков, обсуждаем игровые стратегии, и наконец, придумываем новые игры. Игры как объект исследования интересуют психологов, потому что игра выявляет глубокие и неочевидные психологические стороны человека. К играм неравнодушны солидные бизнесмены: их деловые игры часто помогают преуспеть в своем деле, а игорный бизнес, как принято считать, сам по себе сулит немалые доходы. Разумеется, и математики видят в игре не только развлечение, но и благодатную почву для построения сложных моделей, обобщений и теорий.
Давайте попробуем представить, что именно представляет собой игра и какие игровые проблемы могут представлять интерес для математика. Далее мы рассмотрим классическую задачу теории игр и ее решение, сами построим несложную математическую модель игрового процесса и выясним, каким образом в рамках этой модели можно судить об интересе к игре со стороны игрока. В заключение обсудим полезность нашей модели для разработчиков новых игр.
Секреты популярности
Многообразие игр создает определенные сложности в определении самого понятия игры. Чтобы избежать двусмысленности, попробуем вначале сделать ряд наблюдений, относящихся к наиболее известным нам играм.
Любая игра имеет цель. Если играет один человек, то и цель игры одна. Если же участников больше, чем один, то у каждого из них есть собственная цель. Цели некоторых участников игры (игроков) могут совпадать.
В игре обязательно присутствуют ресурсы, которые каким-то образом распределены между участниками. Каждый участник имеет возможность распоряжаться своими ресурсами по своему усмотрению. Ресурсы всегда ограничены, но возможно, возобновляемы по ходу игры.
В ходе игры происходит смена игровых ситуаций. Для одного игрока каждая ситуация характеризуется определенным количеством принадлежащих ему ресурсов и определенным прогрессом в достижении своей цели. Игровую ситуацию, в которой цель достигнута, а ресурсы еще не кончились, назовем выигрышем. Ситуация, в которой наоборот, истекли ресурсы, а цель еще не достигнута, назовем проигрышем.
Любой игрок всегда имеет возможность выйти из игры (бросить игру). Он также имеет право сыграть повторно. Реальные последствия этих действий не имеют отношения к игре как таковой.
Прочитав первые три пункта наблюдений, Вы наверняка про себя отметили, что игра мало чем отличается от реальной жизни. Справедливо! Но именно последний пункт дает нам ключ к пониманию сути игры. Игра как вид деятельности предоставляет нам уникальную возможность погрузиться в те или иные непривычные, часто экстремальные ситуации, почувствовать вкус борьбы, радость удачи, горечь поражения - и все это с минимальным риском каких бы то ни было негативных последствий в реальной (неигровой) жизни.
Кроме того, часто в игре мы получаем те навыки поведения и тот опыт, которые нужны нам и за пределами игры. Игра очень похожа на модель реального мира. Модель, в которой собраны наиболее яркие и интересные стороны нашей жизни, и отброшено то, что скучно. Модель, которую можно изучить и опробовать многократно. Модель, которую мы сами выбрали и от которой всегда можем отказаться, если она перестанет быть нам интересной. Стоит ли удивляться всеобщей популярности и многообразию игр?
Математики в отношении игр пошли еще дальше. Образно говоря, они вообще стерли грань между игрой и жизнью. Другими словами, исследователя-математика не интересует, получит ли победитель игры свое золото на самом деле, или понарошке, будут ли казнить проигравшего явно или отберут у него виртуальную жизнь. Математику интересно лишь то, как поведут себя игроки во время игры, какие они будут принимать решения, как расходовать ресурсы и будет ли их поведение оптимальным для достижения цели игры.
Более того, когда математику предлагают серьезную неигровую задачу, то он начинает ее рассматривать в рамках некоторой идеализированной модели, тем самым делая из задачи своеобразную игрушку. "Поиграв" с ней и сделав необходимые выводы, он убеждает потребителя в их справедливости в отношении проблемы в целом.
"Теория игр - раздел математики, предметом которого является изучение математических моделей принятия оптимальных решений в условиях конфликта. При этом под конфликтом понимается всякое явление, в котором участвуют различные стороны, называемые множествами игроков и наделенные несовпадающими интересами..."
(Школьная энциклопедия математика, под ред. С.М.Никольского, М.: 1996, С.380)
"Игра (в математике - прим. автора) - это идеализированная математическая модель коллективного поведения: несколько игроков влияют на исход игры, причем их интересы различны."
(Э.Мулен, Теория игр с примерами из математической экономики, М.: Мир, 1985, С.10)
Игра для математика - это прежде всего модель, и как модель она может иметь и имеет ценность в повседневной практике. Противоречия между необходимостью достижения некоторой цели и ограниченностью ресурсов, конфликты между интересами участников, необходимость принимать решения и вырабатывать собственную стратегию - возникают повсюду в нашей жизни: в экономике и управлении, в семье и школе, в политике и спорте и так далее. Математическая теория игр (см. цитаты на врезке) во многих случаях способна указать оптимальный путь к разрешению этих противоречий, а в некоторых случаях - прогнозировать их исход.
Дилемма заключенного
Исследование игр мы начнем с классической задачи, известной в литературе под названием "дилемма заключенного" (Льюс и Райфа, 1957). Суть "игры" состоит в следующем. Двое преступников попадают в камеру для заключенных на длительный срок. У каждого из них есть только два варианта поведения (две стратегии): либо вести себя мирно, либо стать агрессором и попытаться подчинить себе соседа по камере. Сложность выбора стратегии, однако, состоит в том, что каждый заключенный не знает, как поведет себя сосед по камере. Значит, ему необходимо оптимизировать свой выбор в условиях неполной информации о предстоящей игре.
Чтобы сделать правильный выбор, проще всего сравнить предполагаемый выигрыш (или проигрыш) для обеих стратегий. Поскольку стратегий две и преступников тоже двое, то возможных результатов игры будет 2*2=4. Удобно изобразить их в виде таблицы (матрицы) размером 2 на 2.
Таблица. Исходы игры в зависимости от стратегий игроков.
Игрок 2
Мир
Агрессия
Игрок 1
Мир
2
2
0
3
Агрессия
3
0
1
1
Предполагаемый выигрыш в численном выражении для первого игрока показан в левом верхнем углу ячейки, а для второго - в правом нижнем ее углу. Оценки достаточно условны, но отражают качественную сторону конфликта. В частности, из таблицы мы видим, что наибольший выигрыш (3 единицы) получается у агрессора, если его агрессия направлена на миролюбивого соседа. С другой стороны, при взаимной агрессии игроки получают не так уж много (1), по сравнению с тем, что они имели бы, соседствуя мирно (2).
Мы также видим, что агрессивная стратегия является доминирующей: независимо от того, какую стратегию выбрал соперник, выгодно вести себя агрессивно. На этом основании можно утверждать, что в этой игре агрессивная стратегия оптимальна. Сделаем важное замечание: мы предполагаем, что в этой игре игроки лишены возможности вести переговоры для выработки совместной стратегии. Если бы переговоры были допустимы, то следовало бы ожидать проявления мирной стратегии с обеих сторон.
Приведенный пример относится к наиболее простому типу игровых задач, в которых все возможные исходы игры можно перебрать в ячейках так называемой платежной матрицы. Отсюда и название этого класса задач - матричные игры. Простота заключается и в однократном выборе стратегии. Иначе говоря, каждый игрок делает в этой игре только один "ход", а сама игра на этом заканчивается. Более сложные варианты игр могут предполагать бесконечное количество стратегий, множество ходов, возможность временного объединения (кооперации) или даже объединения на всю игру (коалиции) игроков для решения совместных задач. В некоторых играх игроки узнают правила игры не перед игрой, а в процессе игры (так называемые динамические игры), что создает дополнительные сложности в поиске оптимальной стратегии.
Хорошим полем деятельности для специалистов по теории игр является политика. Парламентские и президентские выборы, конфликты политических партий и фракций, формирование блоков и коалиций - практически вся активность игроков-политиков нацелена на достижение своих целей в большой политической игре.
Азартные игры
Строго говоря, азартные игры не являются предметом исследования теории игр. Этот факт легко объяснить: в азартной игре, как правило, исход зависит не от умелых или продуманных действий игрока, а от случайных факторов. Интерес к азартной игре часто подогревается высокими ставками или иными внешними стимулами, уводящие исследователя в сторону от игровых проблем. Однако, иногда об азартных играх говорят в хорошем смысле слова: азартные - то есть увлекательные, захватывающие, не оставляющие никого равнодушным. С этой точки зрения, исследование азартных игр представляет несомненный интерес для создателей новых игр, а значит и для математиков, закладывающих фундамент новых разработок.
В самом деле, какие игры более всего увлекают и почему? Причин тому может быть несколько. Здесь и новизна игровых ситуаций, и своеобразие оформления, и возможность реализовать свои способности. Не менее существенна динамичность игры: обилие экстремальных ситуаций с неочевидным исходом для всей игры. Но что означает динамичность игры на языке математики? Можно ли ее измерить? И можно ли говорить о динамичности игр вообще, сравнивая столь разные игры, какими являются, например, футбол и шахматы? Попытаемся ответить на все эти вопросы, предложив математическую модель игрового процесса.
Как уже отмечалось, в игре может участвовать несколько игроков и их оценка динамичности игры, вообще говоря, может различаться. Поэтому мы будем говорить о восприятии одного из игроков, имея в виду его конкретную цель и соответственно его ресурсы в данной игре.
Игрок может обладать набором ресурсов, каждый из которых в той или иной степени необходим для достижения цели и каждый из которых может быть измерен количественно.
Типичным ресурсом шахматиста является набор фигур, которые он может пожертвовать в ходе игры и при этом поставить мат противнику.
Другим его ресурсом является контрольное время, за которое он обязан сделать определенное количество ходов.
Каково бы ни было количество N ресурсов ri (i=1,...,N) в распоряжении игрока, мы всегда можем вести речь о некоторой обобщенной скалярной величине - ресурсе R(r1,...,rN), который и будет отражать общее состояние с ресурсами у игрока на данный момент игры.
В частности, в начале игры мы можем положить для определенности R=1, в то время как R=0 будет означать отсутствие ресурсов, необходимых для продолжения игры.
Нам потребуется также другая скалярная величина, по которой мы могли бы судить о прогрессе на пути к игровой цели.
Назовем ее целевой функцией и обозначим G (обозначения являются сокращением английских слов: resource = ресурс, goal = цель).
В начале игры мы положим G=0, что означает, что для достижения цели еще ничего не сделано.
Достижению цели будет соответствовать выбранное нами для определенности значение G=1.
Для шахматиста величина G, скорее всего, соответствует так называемому позиционному преимуществу, которое в конце концов приводит к победе.
Измерить его непросто, но в принципе, возможно.
Для футбольной команды G является функцией разницы забитых и пропущенных мячей, а также времени, которое осталось до окончания матча.
(Подумайте сами, как записать эту функцию?)
За развитием игры или за игровым процессом, нам будет удобнее следить, опираясь на переменную t.
Это не обязательно время, ведь во многих играх время строго не учитывается.
Точнее, мы будем считать, что каждому значению t соответствует своя игровая ситуация, которая характеризуется вполне определенным запасом ресурсов у каждого из игроков и вполне определенным прогрессом в достижении своей цели каждым из них.
Величина t в игровом процессе изменяется монотонно от 0 (начало игры) в сторону t>0.
Она может быть непрерывной, как в футбольном матче, или дискретной, как в шахматах, - в зависимости от конкретной игры.
Завершению игры (для нашего игрока) соответствует такое значение te, при котором выполнено одно из двух условий: либо G(te)=1 (достижение цели, выигрыш), либо R(te)=0 (исчерпание ресурсов, проигрыш).
Что касается так называемого "ничейного исхода", то мы не будем его рассматривать отдельно.
В конце концов, каждый игрок (команда) еще до начала игры знают, устраивает их ничья или нет.
Значит, они вправе считать ничью равносильной выигрышу или проигрышу соответственно.
Таким образом, в области 0≤t≤te мы можем описывать игровой процесс с позиций конкретного игрока двумя функциями: R(t) и G(t).
На графиках 1, а-б приведены примеры игровых процессов, которые закончились выигрышем и проигрышем.
Рис.1. Игровой процесс с а) выигрышем; б) проигрышем.
Для того, чтобы судить о динамике игры, а значит, в какой-то мере и об интересе игрока к ней, нам надо оценить, кому в процессе игры принадлежала инициатива, переходила ли она из рук в руки или исход игры был ясен с самого начала.
Введем в рассмотрение функцию инициативы, положив ее по определению равной I(t)=R(t)+G(t)-1.
В соответствии с этим определением и опираясь на рассмотренные выше граничные значения функций R и G, можно заметить, что в начале игры I(0)=R(0)+G(0)-1=0.
В конце игры, в случае выигрыша I(te)=R(te)+G(te)-1>0, а в случае проигрыша - I(te)<0.
В процессе игры рост функции I(t) мы связываем с усилением позиций игрока, а изменение знака этой функции означает переход инициативы из рук в руки.
Можно также отметить, что область значений t, при которых |I(t)|<<1 имеет смысл игровых отрезков борьбы на равных, в то время как отклонение и выход I(t) за пределы указанной области будет означать значительный перевес сил одной из сторон.
Наконец, мы можем дать количественную оценку динамичности D игры, рассматривая ее как отношение суммы длин отрезков борьбы на равных к общей длине игрового процесса te.
Чтобы довести оценку величины D до числа, нам придется заменить качественный критерий |I(t)|<<1 на количественный: |I(t)|<Id, где Id - положительное пороговое значение (константа для нашей модели).
Само собой, величина D зависит не только от правил игры, но и от индивидуальных способностей игрока, его старания и даже везения.
Поэтому первая же задача, которую приходится решать создателю или организатору новой игры, состоит в том, чтобы заинтересовать ею и новичка, и "профессионала".
Если в игре участвуют противоборствующие стороны, то искомое равновесие сил достигается подбором команд (участников) одного уровня, отнесением их в определенные лиги и т.д.
Если же участник игры один, как это часто бывает в компьютерных играх, то сама игра должна иметь возможность настройки на разные уровни мастерства.
Итак, в рамках нашей модели игрового процесса мы показали, что имея возможность количественной оценки ресурсов и прогресса в достижении игровой цели конкретным игроком, мы можем проанализировать ход его борьбы, наличие игровой инициативы и динамику ее изменения.
Ограничение в применении нашей модели разработчиками может быть связано со сложностями в количественной оценке (измерении) указанных величин.
С другой стороны, применительно к компьютерным играм, даже упрощенные способы измерений могут оказаться полезными при рассмотрении логики и принципов поведения отдельных объектов игровой программы.