ТЕОРИЯ ИГР 2024

СО

Сонин

автор материала

vk →

Константин Сонин, https://www.facebook.com/konstantin.sonin(признан иноагентом)

ТЕОРИЯ ИГР 2024, ЧАСТЬ ПЕРВАЯ

Теория игр – непростой для преподавания предмет. Как прикладная математика, несложный – значительная часть того, что входит в базовый курс, требует только школьной математики для понимания. Из анализа не используется вообще ничего, из теории вероятностей – матожидание дискретной случайной величины, что звучит научно, но на самом деле элементарно. (И девятиклассники, и ребята помладше, у которых я преподавал, не затрудняются посчитать – если лотерейный билет приносит 100 рублей с вероятностью 1/10 и 0 в другом случае, сколько он должен стоить?) Пожалуй, первая нетривиальная вещь, связанная с чем-то математическим – там, где встречается условная вероятность и формула Байеса. Не потому что, это сложные формулы – эти формулы простые, а потому что концепция условной вероятности – концепция в общественной науке – не простая.

Основные сложности для преподавания – две и обе связаны с теми феноменом, который теория игр изучает. Теория игр придумана для того, чтобы анализировать реальные ситуации, в которых стратегия играет важную роль. Скажем, когда вы покупаете что-то в магазине, вы не вовлечены ни в какое стратегическое взаимодействие с продавцом. Выбрали, заплатили, получили товар. Тем более покупательнице не важно, что сделает фирма-производитель в ответ на её покупку или не покупку товара. Но крупная фирма, решающая вопрос о том, стоит ли запускать рекламную кампанию, не может не думать – что сделают конкуренты в ответ на те или иные шаги. Невозможно решить, что делать, не глядя на возможные ответы на твои возможные шаги.

Здесь возникает первая концептуальная трудность. Значительная часть анализа в теории игр связана не с тем, что происходит, а с тем, что происходило бы. И сразу же, уже на второй лекции моего курса, оказывается, что то, что могло бы происходить, может быть гораздо важнее того, что реально происходит. Или точнее, то, что реально происходит, определяется стратегическим взаимодействием, которое происходило бы, но не произошло. Пассажирка покупает билет, потому что, если бы не купила, опасалась бы прихода контролёра. Даже если контролёр и вовсе не появляется – его нет в наблюдаемой реальности – покупка билета вызвана тем, что он мог бы появиться. Точно также Билайн не снижает тарифы, потому что ожидает, что если бы он снизил, то МТС и Мегафон снизили бы в ответ и они бы остались при своих долях рынка, но с более низкими тарифами. «Снизили бы в ответ» происходит в неосуществленной реальности, потому что в осуществленной реальности Билайн не снизил тарифы, опасаясь того, что происходило бы в неосуществленной.

Сложность здесь в том, что для того, чтоб анализировать реально происходящее, нужно анализировать то, чего не было. Понятно, что там степеней свободы гораздо больше и, значит, обосновывать те или иные предположения труднее. Однако без этих «вымышленных реальностей» нет возможности анализировать ту реальность, которая состоялась. Драматургу – тому же Шекспиру – проще: он собирает героинь, даёт им выбор действий, после чего рассказывает нам, что все эти Офелии, Полонии, Гертруды, Лаэрты делают. Не нужно рассказывать про то, что они могли бы сделать, но не сделали, хотя это «могли бы, но не» определяет то, что они реально делают по ходу пьесы. Впрочем, Шекспир-то как раз силен тем, что легко представить то, что он описывает, как исход – с учётом последствий всех неосуществленных вариантов – стратегического взаимодействия.

Вторая проблема с использованием теории игр ещё сложнее. Самый примитивный, он же и самый популярный, способ исследовать реальность – это предполагать, что происходящее вокруг – это результат действия какой-то единой силы. Цены на рынке определяются каким-то единым монополистом. Или все фирмы сговорились сделать такие цены. Или, в политике, предполагать, что то, что получилось, это потому что президент так захотел. Или потому что «элиты» сговорились и так захотели. Любая конспирология – это в сущности, результат этого примитивного аналитического метода. Представить, что есть единая сила, которая захотела сделать так, как произошло. (Заметим, что такая «теория» никак не фальсифицируется – это её слабость в научном смысле, и сила – в смысле привлекательности для широкой публики.) Теория игр – самая-самая примитивная модель, самая-самая простая – это уже вызов конспирологическому мышлению. В самой-самой простой модели то, что происходит – результат взаимодействия разнонаправленных сил, действующих в своих разных интересах.

Для меня вот эти две проблемы – во-первых, важность неосуществленных путей для объяснения того, что происходит в реальности, и сложность анализа этих путей и, во-вторых, необходимость бороться с самым распространенным подходом, «всё схвачено» - основные сложности в преподавании теории игр. Впрочем, есть и другие важные вопросы – в отличие от матанализа (где всё, что нужно первокурсникам, знали Лагранж с Коши двести лет назад) и линейной алгебры (где всё знали Шур с Фробениусом сто лет назад), в теории игр кое-то что поняли Зелтен и Харшаньи совсем, по историческим меркам, недавно.

ТЕОРИЯ ИГР 2024, ЧАСТЬ ДВА: ВОПРОС ПРО КОММУНИКАЦИИ

Первые современные определения в теории игры были даны 100 лет назад, центральное и важнейшее понятие, равновесие по Нэшу, появилось 70 лет назад, а основные концепции, необходимые для изложения базового курса – примерно как полвека, в 1970-е. Самый новый результат «большой» результат, который я рассказываю, из статьи 2011 года. Пример, который я использую, чтобы рассказать этот результат, мы первыми записали со Скоттом Гельбахом в 2008 году. Но на уровне фольклора он, конечно, был известен много лет. Но до него ещё надо добраться.

Огромная часть современной теории игр связана с анализом коммуникаций. Понятно, что любую ситуацию, в которой у двух субъектов, участвующих в стратегическом взаимодействии, есть разная информация, изучать очень трудно. Даже просто чтобы поставить вопрос о том, что это значит – «иметь разную информацию», требуется, как оказалось, много сложной математики. Двадцать лет назад, рассказывая про Нобелевскую премию Роберта Ауманна, мы приводили такую задачку, известную всем по математическим кружкам. Два человека едут в поезде и у каждого из них нос в саже. Входит проводница и говорит: «Слушайте, у одного из вас нос в саже». (Заметим, что это фраза - чистая правда и в том случае, если оба носа в саже.) Оба некоторое время сидят без движения, после чего одновременного трут носы, стирая сажу.

В чём тут интересная вещь, про которую сразу даже и не подумаешь. В том, что есть парадокс. Проводница не сказала пассажирам ничего нового! Она сказала «у одного из вас нос в саже». Но они же и так это знали! Каждый из них видел, что у сидящего напротив пассажира нос в саже. То есть, каждый знал, что «у одного из пассажиров нос в саже». Так что же нового они узнали из слов проводницы? Что она им сообщила? А она же им что-то сообщила, раз они после её прихода поняли, каждый про себя, что у него нос в саже, и стали их тереть...

Ответ на вопрос «Что сообщила проводница»? состоит в том, что она сообщила каждому из пассажиров, что другой пассажир тоже знает, что «у одного из пассажиров» нос в саже. До её прихода «у одного из пассажиров нос в саже» было индивидуальным знанием каждого из двух пассажиров. После её прихода «у одного из пассажиров нос в саже» стало, дополнительно, общим знанием двух пассажиров. Информация о носе в саже не изменилась, но изменилась информация, который владел каждый из пассажиров о том, что знает другой пассажир. И это позволило провести небольшую дедукцию, поняв, что и у самого нос в саже.

Эта история, в разных вариантах и модификациях, используется на маткружках в качестве задачи на логику, но, может, и зря. Её не так-то просто описать строго, в математических терминах. Особенно странно выглядит вариант, когда участников (пассажиров или «жителей Багдада») много и, значит, «знание о знании» проходит не одну итерацию в дедукции, а много. В популярном решении задачи эти итерации занимают время, хотя, конечно, никакой временной составляющей в этой задаче нет. После того как фраза сказана, всё понимание, пусть итеративное, происходит мгновенно. В отличие от многих элементарных задачек, которые несложно записать строго, эту записать строго сложно.

Но это ладно. Бог с ней, с «общей информацией». В моём курсе по теории игр мы эти вещи не обсуждаем. Просто предполагаем, что это всё правильно, корректно и интуитивно определено и нет вопроса о том, что такое «общее знание». Когда участник игры «не знает» что-то, то это по определению – «знает все возможные варианты и знает вероятности, с которыми эти варианты случаются». То есть «знающая» знает конкретный вариант, «незнающий» знает распределение вероятностей. Тогда самая простая формулировка игры с коммуникацией выглядит так. «Знающая» что-то говорит, она - «Источник [информации]». На основе слов «знающей» «незнающий» что-то делает, он «Получатель [информации]. Интересы у них могут быть разными и, значит, в интересах Источника манипулировать информацией так, чтобы заставить Получателя действовать в её, Источника, интересах.

Манипулировать информацией, когда речь идёт о рациональных субъектах, понимающих, что ими манипулируют, сложно. Большинство людей, не задумывающихся о том, как устроена дезинформация, имеют в голове какую-то модель, в которой получатель либо нерациональны, либо просто глупы, либо не понимают как их обманывают. Что, конечно, редко бывает адекватным описанием реальности. Люди, видя рекламу, знают, что это реклама и знают, что она сделана для того, чтобы подтолкнуть их к покупке товара. И реклама не действует механически – посмотрела рекламу, купила товар. Если бы она действовала, у нас в домах было бы гораздо больше зубной пасты и стиральных порошков, чем бы использовали. И тем не менее она как-то действует. То же самое из политической рекламой – она может действовать даже тогда, когда получатель знает, что смотрит политическую рекламу и понимает, с какой целью её показывают.

То есть это требование к модели Источник-Получатель чтобы и та, и другой знали «правила игры», Получатель знал, что ему поступает манипулируемая Источником информация. И, тем не менее, действовал, хотя бы отчасти, в интересах Источника в той части, в которой они не совпадают с его интересами.

Вот простейшая ситуация. Источник хочет получить поддержку Получателя. Источник может быть [для Получателя] «хорошей» или «плохой». Само собой, Получатель хочет поддержать Источник, если она хорошая и не поддерживать, если плохая. Разница в интересах состоит в том, что Получатель хочет поддерживать Источник, только если она хорошая, а Источник хочет получить поддержку в любом случае. Единственное, что Источник может делать в этой модели – что-то сказать. После этого Получатель что-то сделает.

Такую модель можно интерпретировать как взаимодействие политика с избирателем, например. Политик хочет получить голос избирателя независимо от того, компетентна политик или нет. Избиратель хочет проголосовать только за компетентного политика, но не знает, компетентная она или нет. Или другой пример. Фирма хочет продать товар покупателю независимо от того, пригодится товар ему или нет. А покупатель хочет купить товар только в том случае, если товар окажется ему полезен – только он, в отличие от фирмы, этого не знает.

Что будет, если Источник знает, хорошая она или плохая для Получателя, а Получатель – не знает? «Не знает» в смысле – знает вероятности, с которым Источник хорошая (и её надо поддержать), но не знает конкретной реализации.

Очевидный первый результат – коммуникации не произойдёт. В равновесии по Нэшу Получатель проигнорирует информацию, полученную от Источника, и сделает то, что хотел бы сделать в отсутствие всякой информации. Почему?

Представим, что Получатель хотел бы, в отсутствие информации, поддержки не оказывать. Не голосовать, не покупать. Теперь представим, что, услышав какие-то слова от Источника, Получатель меняет своё действие и оказывает поддержку. Голосует, покупает. Если так, что Источник, зная что она плохая, скажет эти самые слова, потому что она-то заинтересована в поддержке (голосе, покупке) в любом случае. Но если Получатель понимает, что те слова, которые на него влияют, произносятся в любом случае, то это означает что эти слова никакой информации не несут. Они же произносятся, одни и те же слова, в любом случае – и в случае, когда Источник хорошая и когда она плохая. Значит, Получатель не получает из слов никакой из информации и, значит, будет делать ровно то, что он бы делал, не слыша никаких слов от Источника.

В конечном счёте окажется, что информационное манипулирование возможно. И даже в этом конкретном случае возможно. Но ключевым элементом окажется «институциональный». Источник может убедить Получателя использовать её информацию, если она может связать себя обязательством хотя бы с какой-то вероятностью говорить правду. Что иногда трудно на практике, иногда естественно получается. Томас Шеллинг указал на то, насколько увеличивается переговорная сила той стороны, которая умеет связывать себя обязательствами, по сравнению с той, которая не умеет. Интересно, что в его мире речь не шла про хоть какую-то неопределенность и разность информации у разных сторон в переговорах. Способность создавать связывающие обязательства даёт преимущество и в ситуации, когда информация у сторон различается, и когда не различается.

ТЕОРИЯ ИГР, ЧАСТЬ ТРИ: СВЯЗЫВАЮЩИЕ ОБЯЗАТЕЛЬСТВА

Вот что меня больше всего смущает – раздражает? расстраивает? обескураживает? – в преподавании теории игр. Для профессорки все примеры, которые она приводит, связаны единым математическим упражнением. Одно и то же же стратегическое взаимодействие появляется во множестве реальных ситуаций, которые ничем, кроме одной и той же математической модели, не связаны. Это обычное дело в прикладной математике: одно и то же дифференциальное уравнение, которое может описывать размножение бактерий в пробирке, рост экономики, ядерную реакцию и распространение интернет-мемов по сети. Также одна и та же игра – это и модель конкурирующих рекламных кампаний, и модель гонки вооружений, и модель, объясняющая, почему не удаётся финансировать уборку мусора добровольными взносами. В голове у профессорки – это одна и та же модель, но нормальные, хорошие студенты не могут понять, чем эти истории связаны.

Чтобы проиллюстрировать свою мысль, я сделаю как раз ровно то, что критикую в педагогической практике – расскажу про одну элементарную модель, которая встречается вообще повсюду. На этой модели основана работа институтов, про которые мы читаем каждый день в газетах, на этой модели основано современное понимание политических процессов в мировой истории, она объясняет устройство контрактов, договоренностей и вообще чего угодно. На её основе я покажу, что мне не нравится в том, как мы преподаём теорию игр (и диффуры, кстати).

Игра такая. Первый игрок («он») решает – бросать вызов или нет, после чего Второй игрок («она») решает, принять вызов, то есть бороться, или уступить. Для Первого игрока лучше всего – бросить вызов, чтобы его не приняли, уступили, на втором месте – не входить, на третьем – войти и бороться. Для Второго – лучше всего, чтобы Первый не входил, на втором месте – не бороться, если первый вошёл, на третьем – бороться.

Эти ситуации встречаются на каждом шагу. Фирма А думает, входить ли на рынок. Если Фирма Б, которая уже на рынке, будет “воевать” – демпинг, например - то лучше не входить. А для Фирмы Б - лучше бы, чтобы Фирма А не входила, но если уж войдёт, то лучше не демпинговать, а мирно поделиться прибылью. Или в политике: Байден в 2016 всё думал – участвовать в гонке за кандидатство от демократов против Хиллари или нет. Решил в итоге, что не стоит, хотя обычно вице-президенты участвуют в гонке после ухода своего президента.

В этой игре есть два равновесия. Одно – Первый игрок бросает вызов, Второй уступает. Почему это равновесие? Потому что если Первый бросает вызов, то Второму игроку лучше уступить. Это её рациональный выбор. А если Второй уступает, то Первому лучше бросать вызов. Это вообще идеальный для него исход!

Другое равновесие в этой игре выглядит так. Первый не бросает вызов, а Второй – борется с ним, если бы он вызов бросил. Почему это равновесие? Для Первого выбор понятен: если Второй будет с ним бороться, то самый лучший ответ на это – не бросать вызов. Почему Второй выбирает такую стратегию, тоже понятно. Если Первый не бросает вызов, какая разница Второму игроку, что ей делать в ответ? И в том, и в другом случае она получает одно и то же. Кстати, это идеальный исход для неё.

В этом втором равновесии есть странность. В нем Второй игрок делает не то, что она бы делала, если бы Первый игрок бросил вызов. Если бы он бросил вызов, она бы уступила. Но он не бросает вызов, потому что её стратегия – бороться, если он вызов бросит.

Томас Шеллинг, сначала в «Стратегии конфликта», а потом, через несколько лет в следующей книге, использовал этот пример, чтобы обсудить следующий парадокс. Ядерное оружие – страшная сила, но может ли оно помешать противнику сделать какую-то мелкую пакость? Например, у Шеллинга США думают, не использовать ли танки, чтобы остановить блокаду Западного Берлина (две стратегии – использовать, не использовать), а СССР имеет в ответ возможность нанести тактический ядерный удар или не наносить. Хорошее, для СССР, равновесие по Нэшу – США не использует танки, СССР наносит ядерный удар, если США использует танки. Заметим, в этом равновесии танки не используются, а я ядерный удар не наносится. Какая с этим рассуждением проблема, говорит Шеллинг? Проблема в том, что если США применит танки, то СССР становится невыгодным наносить ядерный удар. Его было выгодно наносить, пока это было угрозой, заставляющей США что-то не делать, но если они уже это делают, то от выполнения угрозы только вред и новые риски. Понимая это, рассуждает Шеллинг, США может использовать танки, не обращая внимание на то, что у СССР есть ядерное оружие. Парадокс.

Шеллинг разрешает парадокс следующим образом. Он цитирует слова Хрущева, тогдашнего руководителя СССР – «наши ракеты полетят автоматически» и интерпретирует их так. Хрущев говорит, в терминах теории игр – смотрите, если США двинут танки, то СССР не будет решать вопрос – применять или не применять ядерное оружие, потому что уже решено, что оно будет применено и это будет ответственность какого-то капитана или полковника, что решение должно быть выполнено. Отсюда появляется важнейший тезис: способность взять на себя связывающие обязательств усиливает переговорную силу. Разве не удивительно? Второй игрок уменьшает количество доступный действий для себя и этим делает себя сильнее! В примере с Первым и Вторым, если Второй игрок может связать себя обязательствами не пересматривать своё решение бороться, то получает преимущество, потому что Первый в этом случае не будет бросать вызов.

Это абстрактное рассуждение – способность связать себе руки даёт преимущество – оказалось, реально, универсальной отмычкой для понимания огромного количество сложных феноменов, не связанных, казалось бы между собой.

МАКРОЭКОНОМИЧЕСКАЯ ПОЛИТИКА. Первый игрок – это «работники», Второй – ЦБ. Работники не стали бы ожидать инфляции, если бы не знали, что, если они не будут её ожидать, ЦБ её устроит. В макроэкономике это называется «принципом динамической несостоятельности», это одно из ключевых объяснений стагфляции в США 1970-х годов, глубокое развитие этой идеи принесло Нобелевскую премию Эдварду Прескотту и Финну Кидланду. Этот феномен, «динамическая несостоятельность» – основная причина того, что современные центробанки организованы, законодательно, как наименее зависимые от текущей политики части государственного аппарата. Та же самая логика. Из-за неспособности того, кто ходит вторым, связать себя обязательствами что-то сделать, возникает неэффективность. Чтобы избавиться от этой неэффективности, создаётся институция (и институт) – независимый центробанк.

МЯГКОЕ БЮДЖЕТНОЕ ОГРАНИЧЕНИЕ. Есть несколько важных, структурных причин, по которым плановые экономики оказались нежизнеспособными. СССР сначала перестал догонять страны-лидеры экономического развития, потом стал отставать, а потом закончил катастрофой, приведшей к распаду и плановой экономики, и всего государства. Янош Корнаи, выдающийся специалист по социалистической экономике, выделил, в качестве одной – одной из нескольких! – фундаментальных причин «мягкие бюджетные ограничения». В плановой экономике фирма, выпускающая ненужную продукцию, продолжает существовать, не банкротясь, потому что правительству важно поддерживать занятость. В результате у менеджеров возникают неправильные стимулы к работе: если провал работы менеджеров не ведёт к увольнению и закрытию, то в чём стимулы прикладывать усилия, правильно определять степень риска и т.п.? «Мягкое бюджетное ограничение» создаёт плохие стимулы для менеджеров предприятия и, значит, способствует стагнации. Тем более, как уже давно понятие, закрытие плохих фирм – важнейший элемент «креативного разрушения», того самого, что сделало Великобритания и потом США локомотивами мирового экономического развития.

Прямо скажем, были ли «мягкие бюджетные ограничения» основной причиной провала плановых экономик, не очень понятно. С одной стороны, очевидно, что к последним десятилетиям СССР продолжала работать масса убыточных предприятий, множество директоров сидело в своих креслах куда дольше, чем нужно было и т.п. С другой – возможно, были и более важные причины. Но факт, что термин, введёный Корнаи, и концепция «мягкого бюджетного ограничения» оказались мощнейшим инструментом для понимания взаимоотношения фирм и политиков во множестве ситуаций и контекстов. Я слышал, как это термин употреблялся в чисто прикладных, практических дискуссиях людьми, крайне далёкими от чтения работ Корнаи про социалистические экономики.

«Мягкое бюджетное ограничение» - это вся та же стратегическая игра. Первый игрок – это менеджер, который решает стараться или не стараться. Второй – правительство, которое решает, увольнять его или не увольнять. «Хорошее», с точки зрения общества и правительства равновесие – то, в котором менеджер старается, а его увольняют, если он не старается. Если бы правительство могло связать себя обязательством уволить, если менеджер не старается, то он бы старался. В капиталистической экономике проблема решается тем, что если фирма убыточная, то она попадает в банкротство без специального решения правительства. А в социалистической играется плохое равновесие, в котором менеджер не старается, а правительство продлевает его контракт.

ПОЛИТИЧЕСКОЕ УСТРОЙСТВО США И ГРАЖДАНСКАЯ ВОЙНА.

Двадцать пять лет назад группа известных политологов-историков предложила метод историко-политического анализа, «аналитический нарратив». Грубо говоря, какой-то исторический эпизод рассказывается с помощью теоретико-игровой модели или серии моделей. Рассказывается как в монографии по истории, с ссылками на первичные источники, архивной работой, академическим контекстом и т.п., но сама статья или книга пишется вокруг модели стратегического взаимодействия. Одним из первых такие аналитические нарративы стал создавать экономический историк Авнер Грейф – его модели, исторический анализ магрибского торговли и института подестрии в Венеции, известны, по-моему, всем. Так вот, для сборника аналитических нарративов Барри Вайнгаст из Стэнфорда взял тему – политическая история добавления новых штатов США в первой половине XIX века, а основная модель, на которую история нанизана, как раз модель с невозможностью связывающих обязательств.

Очень кратко, политическая реальность состоит в том, что какие бы конституции и законы не принимались парламентом, следующий парламент может эти законы отменить и ввести новые. Конечно, в реальном политическом мире есть «трение». Например, какие-то законы требуют супербольшинства. Теоретически их можно поменять мгновенно, было бы супербольшинство, которое тоже можно избрать мгновенно, в очередной выборный цикл. Практически, конечно, одни и те же члены парламента представляют одних и тех же избирателей год за годом, десятилетие за десятилетием и это создаёт стабильность. Часто, в этом состоит замысел, институциональная конструкция. Например, члены верхней палаты парламента в США, Сената, избираются на 6 лет, но выборы каждые два года – то есть каждый раз избирается треть сенаторок. Это было придумано для того, чтобы не получилось так – какой-нибудь популист избрался, приведя с собой парламентское большинство и всё быстро поменял. Из-за того, что в Сенате меняется только «треть», такая демократическая волна должна продолжаться как минимум два избирательных цикла, чтобы преуспеть.

Какая была проблема связывающих обязательств, определяющая политическую динамику в США в десятилетия перед гражданской войной? Южные штаты боялись, что они окажутся в таком меньшинстве в США, что их заставят отказаться от рабства, которое для них было и моральным, и экономическим императивом. Многие элементы конституционного устройства США появились именно из-за этого страха. Южные штаты не стали бы вступать в союз, если бы конституция не давала равных (и даже больших) полномочий верхней палате парламента, в которой каждый штат имел равное представительство. Иначе бы получалось, что более крупные и быстрее растущие северные штаты постепенно становились бы сильнее и сильнее относительно южных. Но чтобы было делать с новыми штатами?

Если бы штаты добавлялись бы естественным путём, то новые западные штаты были бы без рабства (оно им было не нужно, потому что там не рос хлопок). Это бы создавало ровно ту проблему, которая описана моделью – южные штаты согласились бы на присоединение, если бы северные могли как-то связать себя обязательствами не менять конституцию, пользуясь новыми голосами в Сенате. Но они не могли, само собой, и южные штаты не соглашались. А северные, наоборот, не соглашались на принятие рабовладельческих штатов, по той же ровной стратегической причине. Одно из решений было принятие штатов «парами» - один рабовладельческий, а один свободный, чтобы не менялся баланс. Вайнгаст рассказывает историю этих переговоров, их успехи на протяжении десятилетий, и провал, в конце концов, пользуясь всё той же моделью. История от этого не становится проще, но становится понятнее.

ИНСТИТУТЫ ПРАВ СОБСТВЕННОСТИ, ДЕМОКРАТИЧЕСКАЯ ФРАНШИЗА И ВСЁ ОСТАЛЬНОЕ, ЧТО ИЗУЧАЕТ ИНСТИТУЦИОНАЛЬНАЯ ЭКОНОМИКА. Но, конечно, всё это – разменные монетки по сравнению с тем, какую роль играет «проблема связывающих обязательств» в институциональной экономике. Можно сказать, что современная институциональная экономика построена концептуально вокруг этих самых связывающих обязательств. Раз за разом существование какого-то института объясняется тем, что, в его отсутствие, неспособность какого-то актора взять на себя связывающие обязательства приводит к какой-то фундаментальной неэффективности. Чтобы преодолеть эту неэффективность, создаётся институт. Кидланд и Прескотт с их «динамической несостоятельностью» и независимым ЦБ как решением проблемы – тоже предшественники современного институционализма.

Этот подход «невозможность связывающих обязательств – неэффективность – институт, решающий проблему невозможности» вошёл в моду после работ Норта и Вайнгаста про «Славную революцию» в Англии. Их основная работа была архивной – они посчитали, по какой ставке получали кредиты английские короли до Славной революции и по какой – после. Почему сильные короли получали кредиты по высокой ставке? Потому что сильный король – это риск для кредитора. Помните Исаака в «Айвенго»? Принцу Джону можно дать кредит, потому что ему понадобится новый, потому что у него слабая дружина. Ричарду Львиное сердце дать кредит опаснее, потому что он сильный, он придёт за новым кредитом, не возвращая старый. Ещё лучше пример в «Проклятых королях», когда орден храмовников, работавший как современный банк, дал слишком много денег в долг Филиппу Красивому и погорел на этом. Это всё лирическое отступление, конечно – Норт и Вайнгаст анализируют другую эпоху, долговые расписки Стюартов до 1688 года и долговые расписки новой династии после 1688. Основной вывод – институциональные реформы, передача регулярной армии под контролем парламента и т.п. – значительно снизили ставку процента для короны. Почему? Потому что решило проблему невозможности связывающих обязательств, которая при сильных королях была неразрешимой.

Подход Вайнгаст и Норта распространился повсюду. Асемоглу и Робинсон и их последователи успешно применили его к историческому распространению избирательной франшизы. Лидер (король, государь) сталкивается с угрозой бунта (революции, переворота, недовольства). Он мог бы пообещать бунтующим денег в будущем (например, повышения налога на богатых и расходы на инфраструктуру для среднего класса), но каким образом он может связать себя обязательствами? Как они могут быть уверены, что, как только они разойдутся по домам, государь не откажется от своих обязательств? В истории есть множество таких эпизодов. Расширение избирательной франшизы – расширение числа участвующих в выборах, увеличение полномочий выбранных парламентов в части контроля над армией – это способ связать себя обязательствами. Отдать власть – это один из способов гарантировать, что не будешь эту власть использовать.

Собственно, у Асемоглу есть чисто теоретическая работа, в которой история рассказана в дистилированном виде. Есть лидер, есть граждане. Граждане могут стараться, могут не стараться. Они хотят стараться, если им достаётся много из того, что они сделали. Стараются, если их права собственности защищены, сказал бы Адам Смит. Они не хотят стараться, если у них всё сделанное отнимают. Лидер может отнимать всё для себя, может оставлять. Понятно, что в единственном равновесии лидер всё отнимает, а граждане ничего не производят. Зачем производить, если у тебя всё отнимают? Зачем им что-то оставлять, если после этого ничего не происходит? Равновесие. Но если лидер может передать определение ставки налога гражданам, то выигрышный компромисс возможен.

И это работает со множеством реальных экономических институтов – если бы их не было, то тот факт, что кто-то, кто ходит вторым, не может связать себе руки, приводит к неэффективности.

РАЦИОНАЛЬНОЕ ОБЪЯСНЕНИЕ ВОЙН. Специалисты по теории конфликтов десятилетиями обсуждают бесконечные детали в вопросах о том, почему происходят войны. Войны уже лет двести как в основном убыточны для всех участников (как и многолетние судебные тяжбы, к слову) и поиск причин войн – огромная тема в политических науках. И одна из фундаментальных причин – см. статьи и книги Феарона и Пауэлла с формальными моделями войн, или новую популярную книгу Блаттмана – это неспособность какой-то страны взять на себя связывающие обязательства. На международной арене, в отличие от обычного права, все договоренности и контракты должны быть «самосбывающимися». Если работница подписывает контракт с фирмой, то, если одна из сторон нарушает контракт, можно обратиться в суд. Если одна из двух стран нарушила договор, то другая, реально, не может обратиться ни в какой суд. Иными словами, все договоры действуют ровно столько, сколько обеим сторонам выгодно его выполнять.

Конечно, обеим странам соседям бывает выгодно подписать договор о недопущении гонки вооружений. Более того, может быть выгодно его соблюдать. Но как страна может взять на себя обязательство, например, не расти – в смысле производства или населения? И войны, разорительные для обеих сторон, происходят из-за того, что одна сторона боится, что другая станет со временем сильнее, а другая, может, и хотела бы связать себя обязательствами не становится сильнее, но не может. Блаттман начинает с примера, который приводил Фукидид, когда Спарта напала на Афины, опасаясь, что Афины станут сильнее, и дальше приводит десятки примеров этой же самой логики.

Это можно продолжать бесконечно. Скажем, современная теория фирмы ака «теория контрактов» построена, в значительной степени, от примера, в котором две стороны (фирма и фирма, работник и фирма, владелец и менеджер) могли бы приложить больше усилий, но не прилагают, потому что, если приложат, то вторая сторона получит преимущество. Например, если фирма оплатит работнице обучение на продвинутых курсах, то работница скорее уйдёт в другую фирму. С точки зрения теоретико-игровика все, перечисленное выше – одна и та же модель. Но если вместить всё это в одну лекцию (или одну главу книги), то никто, кроме студентки-математика, не поймёт. То есть никто, кроме такого человека, который заведомо игнорирует контекст, фокусируясь на голом математическом скелете. Это надо преодолевать – и я заставляю себя, читая лекция по теории игр, приводя пример, тормозить и рассказывать существо дело. Коротко, но так, чтобы студенты забыли про теоретико-игровую модель, задумались о существу дела и тогда оказывается можно предложить им модель в качестве инструмента для анализа этой ситуации.

Когда я читал «Стратегический анализ во внерыночной обстановке», курс политического анализа для MBA, разработанный в Келлоге, одной из ведущих бизнес-школа мира, там было организационное правило. В каждой лекции разбиралась, без формул, одна модель, которая потом иллюстрировалась подробнейше препарированным примером из реальной жизни. Вот так бы, по хорошему, и курс теории игр читать.

ТЕОРИЯ ИГР, ЧАСТЬ №4: ТОТ ЖЕ МЕХАНИЗМ

Итак, два игрока-участника взаимодействия. Источник («она») говорит, Получатель («он») действует. Источник хочет получить поддержку Получателя. Источник может быть [для Получателя] «хорошей» или «плохой». Получатель хочет поддержать Источник, если она хорошая и не поддерживать, если плохая. Интересы у игроков разные – Получатель хочет поддерживать Источник, только если она хорошая, а Источник хочет получить поддержку в любом случае.

Классическая интерпретация – взаимодействие политика с гражданином. Политик хочет поддержки независимо от того, компетентна она или нет. Избиратель хочет поддерживать компетентного политика, но не знает, какова она на самом деле. Как мы обсуждали в части 2, получатель «не знает» в том смысле, что знает вероятность, с которым Источник хорошая (и её хочется поддержать).

Мы уже разобрались, что если Источник знает ответ на вопрос о своей компетентности достоверно, то никакой информативной коммуникации не произойдёт. Получатель проигнорирует информацию, полученную от Источника, и сделает ровно то, что хотел бы сделать в отсутствие всякой информации. Но оказывается, что успешная манипуляция информацией возможна, если... Если Источник умеет «связывать себе руки» - ограничивать собственные возможности по манипуляции информацией.

Представим, что Источник сама не знает, компетентна она или нет. Опять-таки, «не знает» - то есть знает вероятность, с которой она компетентна. Кажется странным, что человек не знает своей компетентности? На самом деле, это вполне реалистично – «компетентность», в данном случае, это характеристика не только Источника, но и Получателя. Ничего удивительного, что информация Источника об этой характеристике также неполна.

И представим, что Источник может создать специальный Механизм, который будет работать таким образом. Механизм получит информацию о компетентности Источника и передаст сообщение Получателю. Сообщение будет зависеть от информации, которую Механизм получит, но будет зависеть некоторым хитрым образом. Важно, что Получатель знает, каким образом устроен этот механизм – как он перерабатывает информацию в сигнал, который выдает.

Это кажется очень теоретическим, но хорошо моделирует массу вполне стандартных ситуаций. Первый пример был такой. Правительство (источник) назначает какого-то гендиректора канала новостей (механизм). Потом что-то происходит (катастрофа, теракт и т.п.) и канал новостей выдаёт об этом новость в соответствии с теми цензурными правилами, которые ему задало правительство. Конечно, никакой диктатор не сидит и не редактирует поток новостей в прямом эфире – информация превращается в манипулируемую информацию с помощью какого-то механизма.

У Миши Шварца с Мишей Островским, знаменитых экономистов родом из моей 57-ой школы, был когда-то, на заре их карьеры и этой области в экономической теории, другой пример. Гарвард, например (или Чикагский университет, или Принстон) создаёт правила, по которым выставляет оценки свои студенткам и студентам. Университет – Источник, правила выставления оценок – Механизм, информация – работы студенток, сигнал – выставленные оценки. Конечно, эти оценки отражают способности, усилия, талант студенток и т.п. Но они вовсе не обязаны отображать их таким образом, чтобы Получатель (фирмы, нанимающие выпускниц на работу, аспирантуры и т.п.) мог точно вычислить по ним способности и талант.

Как Источнику провести манипуляцию, то есть настроить Механизм, так, чтобы добиться наилучшего для себя результата? Вот так. Если Механизм получает информацию, что Источник компетентна, Механизм выдаёт сообщение «Источник компетентна». Если Механизм получает информацию, что Источник некомпетентна, то Механизм выдаёт сообщение «Источник компетентна» с некоторой вероятностью, а с некоторой сообщает правду, что она некомпетентна. Если информация в пользу источника, Механизм сообщает чистую правду, если не в пользу Источника – иногда правду, иногда нет.

Есть ли смысл делать такой Механизм, который всегда говорит «Источник компетентна»? Конечно, нет! Такой Механизм Получатель будет просто игнорировать и правильно. Такой Механизм полностью неинформативен.

Но можно подобрать вероятность вранья в неблагоприятном случае так, чтобы Получателю было выгодно следовать правилу – поддерживать Источник, если сообщение «Источник компетентна» и не поддерживать, если сообщшение – «Источник некомпетента». Понятно, что если сообщение «не компетентна», то она по-настоящему некомпетентна. А если сообщение «компетента», то как знать – но, поскольку вероятность подобрана правильно, то в этом случае лучше поддерживать, как и хочется Источнику.

Что мы видим? Пример успешной манипуляции информацией – Получатель поддерживает Источника чаще, чем если бы он знал правду. И при том Получатель полностью рационален и знает, как устроен механизм манипулирования. И, несмотря на то, что он это знает, ему выгодно следовать тому сигналу, который поставляет ему манипулятор.

Но основное удивление должно быть оставлено не для того факта, что информационное манипулирование возможно даже тогда, когда объект манипуляции знает, что им манипулируют и знает, каким именно образом. А то мы не знали, что реклама может действовать. (Но, заметим, не полностью лживая реклама!) Или что может действовать цензура. (Но, заметим, не тотальная цензура!) Или что инфляция оценок помогает трудоустройству выпускников лучших университетов. (Но, заметим, не пятерки всем выпускникам!) Самое удивительное – это откуда берётся сила информационного манипулирования.

Информационное манипулирование возможно, когда манипулятор может связать себе руки и уверить объект в том, что руки связаны. В нашем примере Источник ничего не может сделать, никак не может убедить Получателя, если она сама знает свою компетентность и сама решает, что говорить. Ноль влияния. Но если она может, не зная информации, создать Механизм, который сам, без её участия, переработает информацию в сообщение для Получателя, тогда манипуляция становится возможной и приносит Источнику значимую выгоду. Суть дела – в «связывающих обязательствах» из Части 3, а вовсе не в доступе к управлению информацией.

Вот это вот сложно объяснить. Ключевой элемент, который так долго обсуждали в Части 3 без всякой связи с информацией, оказывается ключевым и здесь. Но он какой-то не такой интересный, как собственно манипуляция информацией.

ТЕОРИЯ ИГР, ЧАСТЬ №5: ПРЕВРАЩЕНИЕ В ЗАДАЧКИ

Вот это конкретное сомнение меня гложет постоянно. Весело и легко рассказывать теорию игр на примерах. В конце концов, это же набор инструментов для анализа разных ситуаций. С другой стороны, я раз за разом с ужасом вижу, что для студенток и студентов перенос математического скелета из одного контекста в другой представляет реальное затруднение.

Ты рассказываешь «сказку», чтобы пример легче воспринимался. Например, про то, как прокурорка предлагает сделки двум заключенным и они решают, соглашаться или нет. Профессор-то имеет в виду, что эту же игру будут применять в самых разных ситуациях: и для анализа конкурентной борьбы Apple и Samsung на рынке планшетов, и для элементарного изложения проблем гонки вооружений, и для рассказа о сговоре в аукционе радиоспектра. А студенты запоминают, что им рассказали, как получить признание вины у двух заключенных... И какое это имеет отношение к Apple и Samsung?

Вот пример. Задача просто для математического кружка. Есть N участков дороги, на которых дорожная полиция может поставить посты, чтобы ловить тех, кто превышает скорость. Полиция может поставить К постов, но на все участки не хватает, потому что К меньше N. Если на участке есть пост, а водитель нарушает правила, то, если её ловят, она платит штраф. Штраф такой, что, если тебя точно ловят, то нарушать не хочется. Если водитель точно знает, что на участке есть полицейский, то превышать скорость она не будет. С другой стороны, если вероятность поимки небольшая, то водитель предпочтёт нарушать, потому что штраф умножается на вероятность (маленькую), а удвольствие получаешь достаточно большое.

Чтобы снизить количество нарушений, полиция может расставлять посты как угодно — например, случайным образом. Понятно, что «случайным образом» - это огромное количество разных случайных способов. Можно, например, с одинаковой вероятностью – тогда вероятность встретить пост на каждом участке будет K/N.

В этой задаче два вопроса – во-первых, как поставить посты? Во вторых, нужно ли раскрывать информацию о том, где стоят посты? Ответ не так прост, как кажется, потому что зависит от соотношения параметров – не только от К и N, но и от размера штрафа, который водитель платит, если её поймают, и выигрыша в случае, если водитель проехала участок с превышением скорости, а поста на нём не было.

Если полицейских много, а участков мало, то лучше расставить посты рандомно (равномерно) и не сообщать, где они. Если штраф, умноженный на вероятность K/N, больше удовольствия от превышения скорости, то никто нигде нарушать не будет. (Мы для простоты считаем, что водитель всегда выбирает скорость проезда на каждом участке заранее.) А если меньше? Тогда все будут нарушать на всех участках. Можно с этим что-то сделать? Можно. Например, можно выделить K участков и объявить, что на нём стоят полицейские. Тогда на этих К участках нарушать правила никто не будет, а на оставшихся N-K будут. Но это уже лучше, чем вариант, при котором все нарушают везде.

Можно ли сделать ещё лучше? Можно. Нужно выделить некоторое количество участков, больше K, поставить на них полицейских рандомно и объявить об этом. Назвать участки, которые выделены, сказать, что полицейские стоят рандомно, но не говорить где именно. Тогда на этих участках ограничения будут соблюдаться – то есть на большом числе участков, чем К. Добились большего эффекта, чем предыдущими методами.

Задача понятная, обстановка всем знакомая, решение естественное и интуитивное. Вопрос – понятно ли, что это та же самая задача, про которую я писал в прошлый раз? Это та же самая задача. Источник-получатель, они же рекламодатель-покупатель, они же лидер-гражданин, они же университет-работодатель... Если это формулировать как модель такой общности, что это всё частные случаи, получается очень громоздко. Это сделали Эмир Каменица и Мэтт Генцков, но это так на пальцах не объяснишь. Более того, примеры перестанут быть интуитивными, если идти от абстрактного утверждения к частному. Как сделать так, чтобы пример, который я рассказываю, превращался в инструмент для анализа в разных ситуациях?

ТЕОРИЯ ИГР, ЧАСТЬ №6: ТЕХНИЧЕСКАЯ ТОНКОСТЬ

Как сделать так, в курсе по теории игр, что бы пример, который я рассказываю, превращался в инструмент для анализа в разных ситуациях?

Что я делаю в своём курсе – даю домашние задание на разные типы игр. Например, найдите газетную статью, в которой описано стратегическое взаимодействие, в которой один игрок делает первый ход, а потом второй отвечает на ход первого. Запишите игру, в которой у одного игрока два хода, а у другого игрока – два ответа на каждый из возможных ходов первого.

И вот здесь появляется определение, которое, будучи усвоенным, делит людей на понимающих самые начала теории игр и не понимающих. Это – определение стратегии в игре, в которой сначала ходит один игрок, а потом другой. По этому определению окажается, что у игрока, который ходит первым, две стратегии, а у того, который ходит вторым – четыре. Не две, а четыре.

Тонкость в том, что стратегия второго игрока определяется как пара ходов – ответ на один ход первого и ответ на другой ход первого. Например, всё в той же игре Первый-Вторый, которую мы обсуждали в части №2, где Первый решает - бросать вызов или нет, а Второй – принимать бой или уступать, стратегии Второго, по-хорошему, надо было бы записывать как пару – что делать, если бросили вызов, и что делать, если не бросили. Конечно, если не бросили, то какая разница – игра заканчивается, не начавшись, но по-хорошему, надо было бы и тут их определять.

Помните равновесие в этой игре, в котором Первый решает не бросать вызов, а Второй – принимает бой? Первый потому и не решается бросать вызов, потому что знает, что Второй бой примет. При этом вообще-то, если бы Первый бросил вызов, то Второму лучше было бы уступить. Но равновесие состоит в том, что каждое из действий игроков – это самый лучший ответ на то, что делает другой. Если Первый не бросает вызов, то Второму все равно, что делать, так что принимать вызов, которого нет, - такой же хороший ответ, как не принимать. Точно так же лучший из возможных ответов. А если Второй принимает вызов, то Первому лучше не начинать – Первый же хочет, чтобы боя не было.

Это равновесие – мега-интересное, концептуально. Как раз это равновесие играет ключевую роль в теориях, объясняющих почему, для полноценной борьбы с инфляцией, центральные банки должны быть независимыми, почему Канзас и Мэн нужно было принимать в число новых соединенных штатов одновременно, почему банкиры давали в долг под высокий процент сильным королям, и под низкий – слабым, почему правительства расширяли, в исторической перспективе, избирательную франшизу, почему Спарта напала на Афины, хотя шансы были невысокие, почему фирмы нанимают сотрудников даже тогда, когда функцию можно было бы аутсорсить, и многие другие вещи. Это равновесие, работа которого в реальной жизни ломается тем, что Первый знает, что если он бросит вызов, то Второй, чтобы он не собирался делать, уступит. Институты – независимый ЦБ, армия, подконтрольная парламенту и т.п. – существуют, потому что решают эту проблему, проблему «динамической несостоятельности» из Части №3.

Если бы им определили стратегии по другому, то как можно было бы анализировать игру с точки зрения первого ходящего? Чтобы сравнивать разные ходы, ему нужно сделать предположения о том, как будет ходить второй игрок. Тем, кто играет в шахматы, это очевидно без всякого объяснения. Магнус Карлсен или Александра Костенюк считают на много ходов вперед, игроки послабее – не так на много, но без этих расчётов играть невозможно. Играя в шахматы, нужно все время рассчитывать, какими будут ответы соперника на твои ходы. И дело не только в рассчётах. Недостаточно рассчитывать все возможные сценарии игры, нужно делать предположения о том, что будет делать соперница. Только сделав эти предположения, можно решить, какие ходы делать самому.

Определение, что такое стратегия, которое используется в теории игр шахматистке, наверное, покажется абсурдным. В теории игр одна стратегия одного игрока определяет, что этот игрок делает во всех мыслимых обстоятельствах, которые могут сложиться в игре. То есть для шахмат, одна стратегия первого игрока определяет как ходить в каждой позиции, в которой ход белых. Никакого компьютера не хватит, чтобы записать такую стратегию! По счастью, в абстрактной науке такое определение дать можно. Более того, его и нельзя дать по-другому – как иначе определить, что такое «наилучший ответ»? Ответ же должен быть, как в примере с Первым и Вторым, ответом на что-то? Иначе бы игрок не мог полноценно сравнивать выигрыш в случае разных стратегий.

Шахматы, конечно, хорошо использовать для объяснения этой конкретной, но важной тонкости – что стратегия игрока, по определению, это «план битвы», описание что делать во всех мыслимых обстоятельствах, в которых игрок может оказаться в этой игре. Цермело, известный математик, изучал шахматы, ещё до всякой теории игр. Он доказал, что шахматах обязательно есть равновесие по Нэшу, в том числе и такое, в котором нет проблемы «динамической несостоятельности». И что во всех равновесиях, если их много, исход один. То ли «белые могут добиться как минимум ничьей», то ли «черные могут добиться как минимум ничьей». Проблема с использованием примеров из шахмат совсем небольшая – в прошлом году в Чикаго три студента из сорок подняли руки, когда я спросил, знают ли они такую игру – шахматы? Надо мне примеры из Brawl Stars подготовить, что ли.

СО

Сонин

автор материала

материалы →

Связанные материалы

Статья Кружки нового типа Статья Новый фронт левых сил: авангарды социальных изменений на фоне идущей трансформации труда Статья Почему роль крестьянства в социалистической революции была решающей Статья Тенденции и историческая субъектность