Що наші живі: чому економісти вивчають гру Історія





Йоао Фігуардо

Походження в фортиці XX століття, математична теорія ігор найчастіше використовується в економіці. Але як ми використовуємо концепцію ігор для моделювання поведінки людей в суспільстві? Чому економісти навчаються в якому кутовому футбольному плеєрі частіше вражають штрафні санкції, і як виграти в «Стоні, ножиці, папір» у своїй лекції зауважив старший викладач кафедри мікроекономічного аналізу Вищої школи економіки Данила Федорова

John Nash і the білявка в the бар

Гра в будь-якій ситуації, в якій прибуток агента залежить не тільки від власних дій, а й від поведінки інших учасників. Якщо ви прокладете солярію в домашніх умовах, з точки зору економіста і теорії ігор, це не гра. Припустимо обов'язкове наявність конфлікту інтересів.

У фільмі Mind Games про John Nash, Нобелівський лауреат в економіці, є сцена з блондинками в барі. Він показує ідею, для чого вчений отримав премію, ідею ніш рівноваги, що він сам назвав динаміку управління.

Гра в будь-якій ситуації, в якій виграші агентів залежать один від одного.

Так теоретично гравці в цій ситуації тільки чоловіки, приймають рішення. Їх переваги прості: блондинка краще, ніж брюнетка, і брюнетка краще, ніж нічого. Ви можете діяти двома способами: йти до блондинки або до вашої брюнетки. Гра складається з одного переміщення, прийняття рішень одночасно (тобто ви не можете побачити, де інші пішли, а потім піти самі). Якщо дівчина відхиляє чоловіка, гра закінчується: неможливо повернутися до неї або вибрати інший.

Стратегія – опис дій гравця в усіх можливих ситуаціях.

Який результат гри? Що таке його стабільна конфігурація, від якої кожен зможе зрозуміти, що вони зробили найкращий вибір? По-перше, як Nash правильно викидається, якщо кожен йде в блондинка, це не буде добре. Тому вчений говорить, що кожен повинен піти в брюнетки. Але потім, якщо ви знаєте, що кожен буде йти в брюнетки, він повинен піти в блондинка, тому що вона краще.

Результатом є поєднання обраних стратегій.

Це реальний баланс - результат, в якому один йде в блондинка і відпочинок в брюнетки. Це може здатися несправедливим. Але в ситуації балансу ніхто не може пошкодити свій вибір: ті, хто йде в брюнетки, розуміють, що вони все ще будуть нічого від блондинки. Таким чином, Nash equilibrium є конфігурацією, в якій ніхто не хоче змінити стратегію, обрану всім. Це, що відображає в кінці гри, кожен учасник усвідомлює, що навіть знаючи, як інші, він буде робити однаково. Ще один спосіб викликати результат, де кожен учасник реагує на дії інших.



"Стон, ножиці, папір"


Давайте подивимося на інші ігри для балансу. Наприклад, в Кам'яному, ножиці, папір немає ніш рівноваги: у всіх його ймовірних результатах немає можливості, в якому обидва учасники будуть задоволені вибором. Тим не менш, є Всесвітній Кубок світу та Всесвітній рок-паперовий товариства, який збирає статистику ігор. Якщо ви знаєте щось про нормальну поведінку людей в цій грі.

Чиста стратегія в грі - це стратегія, в якій людина завжди грає однакову гру, вибираючи однакові рухи.

Згідно Всесвітнього товариства РПС, камінь найбільш часто вибирається рух (37.8%). Папір покласти 32,6%, ножиці - 29,6%. Тепер ви знаєте, що ви повинні вибрати папір. Але якщо ви граєте з кимось, хто знає його, ви не повинні вибрати папір, тому що ви очікуєте, щоб зробити те саме. Є відомий випадок: в 2005 році два аукціонні будинки Сотеби та Крісті вирішили, що отримати дуже велику кількість – збірка Пікассо та Ван Гог з початковою ціною $ 20 млн. Власник запропонував їм грати кам'яні, ножиці, папір та представники будинків, які надішали йому свої варіанти. Сотеби, вони пізніше сказали, вибрали папір без думки. Вон Крісті. Зробляючи рішення, вони перевернулися до експерта - 11-річна дочка директора вражень. Вона сказала: «Кам'яний камінь здається найсильнішим, тому більшість людей вибирають його. Але якщо ми не граємо з абсолютною кукі, він не відкине камінь, він очікує нас, і він відкине сам папір. Але ми думаємо вперед і відкидаємо ножиці.

Таким чином, ви можете думати вперед, але це не обов'язково призведе до перемоги, тому що ви не можете знати свою компетентність супротивника. Тому, іноді, замість чистих стратегій, краще вибрати змішані, тобто приймати рішення за шансом. Наприклад, в Кам'янці, ножиці, папір, рівновага, яку ми ще не знайшли, точно в змішаних стратегіях: вибрати кожен з трьох варіантів з ймовірністю третини. Якщо вибрати камінь частіше, то суперник налаштує свій вибір. Знаючи це, ви будете скорегувати ваші і баланс не вийде. Але ніхто не почне змінювати поведінку, якщо кожен тільки вибирає камінь, ножиці або папір з однаковою ймовірністю. Це тому, що в змішаних стратегіях неможливо передбачити наступний рух.

Змішані стратегії та спорт



Існує безліч прикладів змішаних стратегій. Наприклад, де подавати в теніс або бити / взяти штраф у футбол. Якщо ви не знаєте нічого про ваш супротивник або просто постійно грайте проти різних, найкраща стратегія полягає в тому, щоб діяти більш-менш випадково. У 2003 році Ігнасіо Паласіос-Гуерта, професор Лондонської школи економіки, опублікував статтю в Американському Економічному огляді, що прагнув до рівноваги наташу в змішаних стратегіях. Предмет дослідження Паласіос-Гуерта обрали футбол і в цьому плані спостерігали понад 1 400 штрафних ударів. Звичайно, в спорті все влаштовується більше, ніж в "Stone, Scissors, Paper": вона враховує сильну стопу спортсмена, виходячи з різних кутів при впаданні всіх сил і подібного. Неш рівновага тут складається з варіантів розрахунку, тобто, наприклад, визначення кутів мети, які потрібно вдарити для того, щоб перемогти більшою ймовірністю, знаючи слабкості і міцності. Статистика для кожного гравця, і баланс, знайдений в них в змішаних стратегіях, показали, що футболісти роблять щось схоже на прогноз економістів. Важко сказати, що люди, які б’ють штрафні санкції, читати підручники з теорії ігор і зробили досить складну математику. Найімовірніше, є різні способи дізнатися, як правильно поводитися: ви можете бути блискучим футболістом і відчувати, що робити, або ви можете стати економістом, і знайти баланс в змішаних стратегіях.

У 2008 році професор Ігнасіо Паласіос-Гуерта зустрівся з Абрахемом Грант, тренером, який потім був грає в фіналі Ліги чемпіонів у Москві. Вчений написав замітку тренеру з рекомендаціями щодо штрафних пагонів, які стурбовані поведінкою воротаря супротивника - Едвін ван дер Сара з Манчестера. Наприклад, за статистикою він практично завжди воював постріли на середньому рівні і частіше кинувся на природну сторону пеня. Як ми визнали вище, краще випадковим чином одержувати вашу поведінку, враховуючи знання про супротивника. Коли штрафний бал вже 6-5, Ніколя Анелка, нападник Челсі мав би забити. Увімкнення правого кута перед ударом, ван дер Сар, здавалося, попросити Анелк, якщо він збирався потрапити туди.



Підсумок челсі полягає в тому, що всі попередні удари були вражені точно в правому від забиваючого кута. Ми не знаємо точно тому, можливо, через поради економіста, щоб збити в неприродному напрямку для них, адже за статистикою вандер Сар менш готовий до цього. Більшість гравців Челсі були правою рукою: потрапивши неприродний правий кут, всі вони, крім Террі, забиті. Звісно, стратегія була для Анелки, щоб пробити в ньому. Але ван дер Сар здається, що він з'явився. Він діяв блискучо: він продемонстрував у лівому куті, щоб сказати: «Ви збираєтеся вдарити там?», з якого Анелка, ймовірно, була захоплена, бо він вирішив. У останній момент він вирішив діяти по-різному, вдарив природну сторону, яка була те, що Ван дер Сар необхідний, який взяв цей постріл і забезпечив перемогу Манчестера. Ця ситуація вчить випадковий вибір, тому що будь-який Ваше рішення може бути розраховане і ви втратите.

В'язниця Dilemma

Можливо, найвідоміша гра, яка починається університетські курси з теорії ігор є Дилмма Тюрма. За легендою, два підозри в серйозному злочині були спіймані і зафіксовані в різних клітинах. Доведено, що вони мали зброю, і що дозволяє їм за короткий період часу. Тим не менш, не існує доказів, що вони зробили це страшним злочином. Кожен окремий слідчий розповідає про умови гри. Якщо обидва чоловіки зізнаються, як буде засуджено до трьох років в тюрмі. Якщо один зізнається, і ось мовчаться акомпаш, зізнається негайно, і другий буде ув'язнений протягом п'яти років. Якщо, навпаки, перше не визнається, а другий переходить його, то перший буде сидіти протягом п'яти років, а другий вийде одночасно. Якщо ніхто не зізнається, як буде загиблим на рік для володіння зброї. Неш рівновага тут є першим поєднанням, де обидва підозри не мовчаться, і обидва сидять протягом трьох років. Кожна причина: Якщо я говорю, я сидю протягом трьох років, якщо я залишатися мовчним, протягом п'яти років. Якщо інший німий, я краще сказати, що краще не сидіти, ніж сідати на рік. Це домінна стратегія: розмова вигідна, незалежно від того, яка інша людина робить. Однак, є проблема з ним – має кращий варіант, адже сісти на три роки гірше, ніж сісти на рік (якщо ви подивитеся на історію тільки з точки зору учасників і не враховуйте моральні питання). Але не можна сидіти на рік, тому що, як ми розуміли вище, це некомерційне для обох злочинців, щоб залишатися безшумним.

Поліпшення батьків

Є відомий метафор про невидиму руку ринку, що належить Адаму Сміту. Він сказав, що якщо алер постарався заробити гроші на себе, це буде краще для всіх: він зробить смачне м'ясо, яке б купити пекар з грошима від продажу бункерів, які він, в свою чергу, також доведеться зробити смачними для них, щоб продати. Але виходить, що ця невидима рука не завжди працює, і є багато ситуацій, коли всі діють для себе, і кожен поганий.

Таким чином, іноді економісти і гей аорти думають не про оптимальну поведінку кожного гравця, тобто не про ніш рівновагу, але про результат, в якому все суспільство буде краще (у Дилмії суспільство складається з двох злочинців). З цієї точки зору, результат ефективний, коли не існує поліпшення Парето, тобто неможливо зробити когось краще, не роблячи інших гірше. Якщо люди просто стрибають товарів і послуг, це Парето-імпровізація: вони роблять це добровільно, і навряд чи хтось поганий для нього. Але іноді, якщо ви просто дозволите людям взаємодіяти і навіть не заважати, що вони отримують не Парето оптимальне. Це те, що відбувається в Дилмії в'язниці. У цьому випадку, якщо ми допускаємо всіх, щоб діяти таким чином, що коригує їх, виходить, що це погано для всіх. Кожна людина повинна бути кращою, якщо всі не діяли оптимально для себе, тобто вони мовчать.

Трагедія громади

В'язниця Dilemma - це іграшка стилізована історія. Ви не можете очікувати, щоб знайти себе в подібній ситуації, але є подібні ефекти навколо нас. Розглянемо «Ділема» з великою кількістю гравців, іноді називають трагедія громади. Наприклад, на дорогах, і я вирішив, чи варто йти на роботу: на машині або автобусі. Що все інше. Якщо ви їдете на машині і кожен вирішує зробити те ж саме, буде джем трафіку, але ми завжди будемо їздити. Якщо ви їдете на автобусі, то ще буде гасіння трафіку, але я буде некомфортний і не набагато швидше, тому цей результат ще гірший. Якщо, в середньому, кожен їде на автобусі, я зроблю те ж саме і отримаєте досить швидко. Але якщо в таких умовах їздити на машині, я теж буде там швидко, але і з комфортом. Так, не залежно від того, що я зроблю. У ситуації, де кожен вибирає їздити. Що б інші зробити, я краще вибрати автомобіль, тому що буде джем або ні, я не знаю, але я буду їздити в комфорті в будь-якому місці. Це домінантна стратегія, тому в кінці, всі диски і ми маємо те, що ми маємо. Завдання держави полягає в тому, щоб зробити автобусну подорож кращим варіантом принаймні деякі, тому в центрі, парковці і т.д. Ще одна класична історія – раціональна ігнорування виборців. Уявіть, що ви не знаєте результат виборів заздалегідь. Ви можете вивчати програму всіх кандидатів, послухати дебатів, а потім голосувати за краще. Друга стратегія полягає в тому, щоб потрапити на дільницю і голосувати випадково або для кого, хто був частіше показаний на телевізорі. Що таке поведінка є оптимальним, якщо мій голос ніколи не визначає, хто виграє (і в країні 140 мільйонів, один голос ніколи нічого не буде вирішувати)? Звісно, я хочу гарного президента в цій країні, але я знаю, що ніхто ще не буде виглядати на програмах кандидатів. Не витрачається час – домінантна стратегія.

Коли ви назвали, щоб приїхати на суботу, це не буде до будь-якого, щоб вирішити, чи є дворик чи ні: якщо я виходжу самостійно, я не можу очистити все, або якщо ви вийшли, я не буду йти, тому що кожен буде чистоти без мене. Ще одним прикладом є доставка в Китай, де я дізнався про дивовижну книгу Стівена Лендсбурга. Економіст на дивані. 100-150 років тому в Китаї був поширеним способом перевезення вантажів: все складалося в великому тілі, який перетягував сім осіб. Клієнти, які були доставлені вчасно. Уявіть, що ви один з тих шести. Ви можете зробити зусилля і витягувати, як ви можете, і якщо кожен робить, вантаж прибуде вчасно. Якщо хтось не робить цього, кожен буде там час. Всі думки, «Якщо хтось ще тягнеться важко, чому це робити, і якщо хтось ще тягнеться, то я не можу змінити нічого». Як результат, з часом доставки, все було дуже погано, і самі навантажувачі знайшли вихід: вони почали наймати сьомого і оплатити його гроші, щоб збивати лідачі з вії. Дуже наявність такої особи, яка зробила всі роботи максимально складно, тому що в іншому випадку кожен впав в поганий баланс, від якого не може бути прибутково.

Те ж саме можна спостерігати в природі. Дерево, що росте в саду, відрізняється від того, що росте в лісі своєю кроною. У першому випадку оточує весь багажник, в другому - знаходиться тільки вгорі. У лісі це ніш рівновага. Якщо всі дерева погодилися і виросли однаково, вони розподіляються фотонами, і кожен буде краще. Але це не вигідно для всіх, хто це зробити індивідуально. Тому кожен дерево хоче виростити трохи вище інших.

Товарний пристрій

У багатьох ситуаціях один гравець може знадобитися інструмент, щоб переконувати інших, які вони не розмиті. Це називається відданим пристроєм. Наприклад, закон деяких країн забороняє виплату борщів для зменшення мотивації злочинців. Однак це законодавство часто не працює. Якщо Ваш родич захоплений і ви маєте можливість зберегти його, вказавши закон. Уявіть, що закон може бути занепокоєний, але родичі були бідними, і вони не могли платити ransom. У цій ситуації злочин має два способи: звільнити або вбити жертву. Він не любить вбити, але він не схожий на тюрма. Випущений потерпілий, в свою чергу, може або перевірити так, що дитина покарається або залишається безшумним. Найкращий результат для злочину, який не перетворить його. Потерпілий хоче бути випущеним і перевіреним.

Залишок тут є те, що терорист не хоче бути спійманим, що означає, що жертва гине. Але це не Парето рівновага, тому що є варіант, де все краще відключати - жертва на великому мовчить. Але робити це, необхідно зробити його вигідно для неї, щоб залишитися безшумним. Я прочитав десь, що вона може попросити терористів робити еротичні фотосесії. Якщо кримінальне право порушено, його акомпанези будуть розміщувати фотографії в Інтернеті. Тепер, якщо дитина залишається безкоштовною, це погано, але публічні фото ще гірше, тому ви отримаєте баланс. Для потерпілого це спосіб залишитися живим.

Якщо мова йде про економіку, ми беремо економічний приклад. У моделі Bertrand два магазини продають той же елемент, купуючи його від виробника за однаковою ціною. Якщо ціни в магазинах є однаковими, то їх прибуток про те ж саме, адже тоді покупці вибирають магазин за шансом. Єдиний Nash equilibrium тут є продаж за вартістю. Але магазини хочуть заробити гроші. Таким чином, якщо ви поставите ціну від 10 рублів, другий знизить його за допомогою копійки, тим самим збільшуючи його дохід навпіл, так як всі покупці підуть до неї. Таким чином, це вигідно для учасників ринку, щоб зменшити ціни, тим самим розподілити прибуток серед себе. Давайте розглянемо вибір між двома можливими рівновагами. Уявіть, що Petya і Masha збираються зустрітися один з одним на вузькому шляху. Дорога так вузька, що потрібно перетягнути. Якщо вони вирішили повернути ліворуч або праворуч від себе, вони просто відступають. Якщо один перетворюється вправо і інший на ліву, або навпаки, буде виникне випадково. Як вибрати, куди рухатися? Щоб допомогти знайти баланс в таких іграх, є, наприклад, правила руху. У Росії всі необхідно повернути право.

У Чікені, коли два люди їздить на високій швидкості до одного, є ще два баланси. Якщо обидва повертають на сторону дороги, ситуація називається Чікеном, якщо обидва не повертаються, вони гинуть в страшній аварії. Якщо я знаю, що мій супротивник буде прямо, це добре для мене, щоб вижити. Якщо я знаю, що мій супротивник залишить, то це вигідно для мене, щоб отримати $100. Важко передбачити те, що відбувається, але кожен гравець має власний спосіб виграшу. Уявіть, що я зафіксував кермовий круг, щоб він не був вимкнений, і показав його своїм супротивником. Знаючи, що у мене немає вибору, опонент буде відступати.

Іноді дуже складно переїхати з одного рівноваги до іншого, навіть якщо це означає добре для всіх. Планування QWERTY була створена для сповільнення швидкості друку. Тому що якщо кожен виданий занадто швидко, заголовки машинки, які вражають папір, будуть чіплятися один одному. Так Крістофер Шольс розміщував часто стоячі листи якнайбільше. Якщо ви йдете в налаштування клавіатури на вашому комп'ютері, ви зможете вибрати макет Dvorak там і набрати набагато швидше, так як немає проблеми з аналоговими принтерами прямо зараз. Дворак очікував світ піти на клавіатуру, але ми досі живемо з QWERTY. Звісно, якщо ми переїхали до макету Дворака, майбутній покоління буде вдячний нам. Всі ми будемо ставити в зусилля і відрелігувати, і результат буде рівновагою, в якому кожен виданий швидко. Тепер ми в балансі, в поганий. Але це не вигідно для всіх, хто відреагує, бо буде незручно працювати на будь-якому комп'ютері, крім особистого.

Джерело: теоріяandpractice.ru