Со временем народная молва изменила данное Такером изображение дилеммы заключенного. Угроза тюремного заключения выглядит куда убедительней сулимой награды. Вспомним, что заключенные содержатся раздельно и не могут общаться, так что каждому остается лишь гадать, как поступит другой. Заключенный, донесший на своего напарника, освобождается, а тот, соответственно, получает три года. Если же оба решат свидетельствовать друг против друга, то получают по два года тюрьмы. Если же ни один из них не станет доносить, оба получают по году тюрьмы. Так как это теория игр, то каждого игрока волнует лишь собственное благополучие. I Рассуждая рационально, каждый придет к выводу, что донос уменьшит на год срок его заключения независимо от поведения другого. Отказ от доносительства не даст игроку свалять дурака – смолчать, когда другой предаст. Но ведь если они оба откажутся давать показания, то отделаются лишь годом тюрь– I мы. Вот в чем задача: каждый, действуя в собственных интересах, добивается нежелательного для себя результата.
Математическое представление игры сведено в таблицу, где строки и столбцы отображают стратегию каждого из игроков. Пары чисел в ячейках указывают на платежи. В соответствии с 1 исходными посылами исследователей RAND платежи таковы, что награда за обоюдное сотрудничество с полицией (в общем случае означающее кооперацию, солидарность, учет общих интересов, разрешение конфликта, альтруистическое поведение) превышает штраф за обоюдное молчание (в общем случае здесь подразумевается отказ от сотрудничества, усиление конфронтации, обман, нарушение принятых норм, правил, обязательств, эгоистическое поведение); оба же этих платежа превышают платеж дурака за его сотрудничество при молчании другого игрока, но меньше платежа-соблазна за молчание одного при сотрудничестве (с полицией) другого игрока. Все четыре общественные игры-дилеммы корпорации RAND оказываются разновидностью одной исходной модели: обратив платеж дурака и платеж-соблазн, из «Дилеммы заключенного» получаем «Игру с трусом», а поменяв местами платеж-награду и платеж-соблазн, имеем уже дело с «Охотой на оленя».
В сотрудничает В отказывается от сотрудничества
А сотрудничает 2,2 0,3
А отказывается от сотрудничества 3,0 1,1
В 1979 году политолог Роберт Аксельрод «интересовался кооперацией, что явилось поворотным шагом в истории теории умных толп:
«Все началось с простого вопроса: когда при оценивании надо сотрудничать, а когда проявлять своекорыстие? Надо ли продолжать оказывать любезность приятелю, не отвечающему тем же? Надо ли одному предпринимателю срочно помочь другому, находящемуся на грани разорения? Насколько жестко надо США начать Советский Союз за враждебное действие, и какой образ поведения могут избрать США, чтобы добиться сотрудничества со стороны Советского Союза? Есть простое средство изображения обстоятельств, способных породить подобные вопросы, и связано оно с привлечением повторяющейся игры „дилемма заключенного“. Дания игра позволяет игрокам выгадывать от обоюдного сотрудничества, но также дает возможность одному игроку использовать другого или же обоим отказаться от сотрудничества» [33].
Игра «Дилемма заключенного» дает любопытные закономерности при ее многократном повторении. Хотя игроки не могут сообщать о своих намерениях при совершении текущего хода, история предыдущих решений позволяет оценивать намерения другого игрока. Согласно Аксельроду «как раз возможность повторной встречи и создает предпосылки к сотрудничеству». Иначе говоря, сделанный сегодня Выбор не только определяет исход данного хода, но и может посиять и на последующие решения игроков. Будущее способы бросить тень на настоящее и тем самым воздействовать на текшее положение дел». «Репутация» – еще одно средство разглядеть ту самую «тень будущего».
Аксельрод предложил «Соревнование на ЭМ по дилемме заключенного» среди вычислительных программ. (В турнире участвовали 63 программы. Каждая пара программ проводила Друг с другом серии по 200 игр. Точное число игр авторам программ не сообщалось. Присланные программы одержали как простые стратегии, так и весьма изощренные, использующие методы прогнозирования и искусственный интеллект. Победителем объявлялась программа, набравшая в турнире больше всего очков.) Каждая программа на каждом своем шаге выбирает сотрудничество или отказ от него, тем самым зарабатывая очки согласно платежной матрице данной игры. Каждая программа могла учитывать предысторию хода противника. Входные данные Аксельрод брал у представителей теории игр из экономики, психологии, социологии, политологии и математики. Он использовал четырнадцать таких наборов входных данных, прогоняя их неоднократно на ЭВМ случайным образом. «К моему удивлению, – пишет Аксельрод, – победителем оказалась самая простая программа – „Услуга за услугу“ {Tit for tat), присланная Анатолем Рапопортом*. Стратегия «Услуги за услугу» строилась незатейливо: начинать надо с сотрудничества, а затем повторять действия противной стороны на предыдущем шаге». Если противник на первом ходу сотрудничает, следующим ходом «Услуга за услугу» тоже сотрудничает; если же противник первым ходом отказывается сотрудничать, отказом на следующем ходу отвечает и «Услуга за услугу». Когда же противник от отказа переходит к сотрудничеству, то же самое следующим ходом делает «Услуга за услугу», как бы прощая его.
Во втором турнире Аксельрод попросил участвовать эволюционных биологов, физиков и специалистов по вычислениям. Создателям программ было разрешено внести коррективы в разработанные ими стратегии игры с учетом результатов первого турнира. И вновь победила «Услуга за услугу», что весьма озадачило Аксельрода:
* Рапопорт Анатоль (Анатолий Борисович) (род. 1911, Россия), американский философ, представитель операционализма, биолог, психолог. В 1941 г. окончил Чикагский университет. С 1955 г. профессор математической биологии Института психиатрии Мичиганского университета. Один из основателей (1955) и президент (1965-1966) Международного общества по исследованию проблем общей семантики. Один из ведущих редакторов журналов ETC и Behavior Science. Получил известность благодаря анализу связей между языком, мышлением и действием. Проводил исследования использования языка в конфликтных ситуациях. Одним из первых применил теорию игр для анализа поведения, о чем написал в книге «Дилемма заключенного» (Prisoner's Dilemma: A Study in Conflict and Cooperation, 1965, совместно с Альбертом M. Чама).
«Мы здесь наблюдаем нечто любопытное. Подозреваю, что качества, предопределившие успех стратегии „Услуга за услугу“, проявят себя и в мире, где допустимы какие угодно стратегии. Если это так, то основанная исключительно на взаимности кооперация представляется вполне возможной. Но мне хотелось определить точные условия, необходимые для поощрения кооперации при таких обстоятельствах, что привело меня к эволюционному подходу: представлению о том, как возможно возникновение сотрудничества без центральной власти. Эволюционный подход порождает три вопроса. Во-первых, каким образом поначалу удается закрепиться потенциально кооперативной стратегии в сугубо некооперативной среде? Во-вторых, какого рода стратегия в состоянии развиться в столь неоднородной среде, состоящей из множества людей, использующих более или менее изощренные стратегии? В-третьих, при каких условиях подобная стратегия, утвердившаяся среди определенного круга лиц, способна противостоять менее кооперативной стратегии?»
Повозившись с моделированием игр, Аксельрод получил, по крайней мере на уровне теории игр, ответ на первый вопрос: внутри множества исключительно некооперативных стратегий кооперативные стратегии возникают из небольших совокупностей людей, решившихся сотрудничать, даже если самим кооперативным стратегиям в их взаимоотношениях отведено небольшое место. Такие группы кооператоров быстрее набирают очки по сравнению с теми, у кого отсутствует сотрудничество. Основанные на кооперации стратегии способны выстоять в противостоянии с другими стратегиями, и «возникшее однажды на основе принципа взаимности сотрудничество в состоянии теперь выдержать натиск менее кооперативных стратегий. Тем самым шестерни социальной эволюции обзаводятся храповиком».