Mikä on vankien ongelma?

Itse pelissä rangaistuksia (ja palkintoja tarvittaessa) edustaa apuohjelma numeroita. Positiiviset luvut edustavat hyviä tuloksia, negatiiviset luvut edustavat huonoja tuloksia, ja yksi tulos on parempi kuin toinen, jos siihen liittyvä luku on suurempi. (Ole kuitenkin varovainen, kuinka tämä toimii negatiivisten lukujen kohdalla, koska esimerkiksi -5 on suurempi kuin -20!)

Yllä olevassa taulukossa kunkin ruudun ensimmäinen numero viittaa pelaajan 1 tulokseen ja toinen numero edustaa pelaajan 2 tulosta. Nämä numerot edustavat vain yhtä monista numerosarjoista, jotka ovat yhdenmukaisia vankien dilemma-asennuksen kanssa.

Kun peli on määritelty, seuraava vaihe pelin analysoinnissa on arvioida pelaajien strategioita ja yrittää ymmärtää kuinka pelaajat todennäköisesti käyttäytyvät. Taloustieteilijät tekevät muutamia oletuksia analysoidessaan pelejä - ensinnäkin, heidän oletetaan, että molemmat pelaajat ovat tietoisia voitot sekä itselleen että toiselle pelaajalle, ja toiseksi, heidän oletetaan, että molemmat pelaajat etsivät että rationaalisesti maksimoida oma voitto pelistä.

instagram viewer

Yksi helppo alkuperäinen lähestymistapa on etsiä niin kutsuttuja hallitsevat strategiat- strategiat, jotka ovat parhaat riippumatta siitä, minkä strategian toinen pelaaja valitsee. Yllä olevassa esimerkissä tunnustamisen valitseminen on hallitseva strategia molemmille pelaajille:

Koska tunnustaminen on parasta molemmille pelaajille, ei ole yllättävää, että tulos, jossa molemmat pelaajat tunnustavat, on pelin tasapainoinen lopputulos. Toisin sanoen on tärkeää olla hiukan tarkempi määritelmämme kanssa.

Käsite a Nashin tasapaino oli kodifioinut matemaatikko ja peliteoreetikko John Nash. Yksinkertaisesti sanottuna Nash-tasapaino on joukko parhaita vastausstrategioita. Kahden pelaajan pelissä Nash-tasapaino on tulos, jossa pelaajan 2 strategia on paras vastaus pelaajan 1 strategiaan ja pelaajan 1 strategia on paras vastaus pelaajan 2 strategiaan.

Nash-tasapainon löytäminen tämän periaatteen avulla voidaan havainnollistaa tulostaulukossa. Tässä esimerkissä pelaaja 2: n parhaat vastaukset pelaajaan on ympyröity vihreänä. Jos pelaaja 1 tunnustaa, pelaajan 2 paras vastaus on tunnustaa, koska -6 on parempi kuin -10. Jos pelaaja 1 ei tunnusta, pelaaja 2: n paras vastaus on tunnustaa, koska 0 on parempi kuin -1. (Huomaa, että tämä päättely on hyvin samanlainen kuin päätelmä, jota käytetään dominoivien strategioiden tunnistamiseen.)

Pelaajan 1 parhaat vastaukset on pyöreä sinisellä. Jos pelaaja 2 tunnustaa, pelaajan 1 paras vastaus on tunnustaa, koska -6 on parempi kuin -10. Jos pelaaja 2 ei tunnusta, pelaajan 1 paras vastaus on tunnustaa, koska 0 on parempi kuin -1.

Nash-tasapaino on tulos, jossa on sekä vihreä että sininen ympyrä, koska tämä edustaa joukko parhaita vastausstrategioita molemmille pelaajille. Yleensä on mahdollista olla useita Nash-tasapainoja tai ei ollenkaan ollenkaan (ainakin puhtaissa strategioissa, kuten tässä kuvataan).

Olet ehkä huomannut, että Nash-tasapaino tässä esimerkissä vaikuttaa tavalla, joka ei ole optimaalinen (erityisesti siinä mielessä, että se ei ole Pareto-optimaalinen), koska molemmat pelaajat voivat saada -1 eikä -6. Tämä on luonnollinen tulos pelissä esiintyvästä vuorovaikutuksesta - teoriassa tunnustamatta jättäminen olisi optimaalinen strategia ryhmälle kollektiivisesti, mutta yksilölliset kannustimet estävät tämän lopputuloksen olemassaolon saavutettu. Esimerkiksi, jos pelaaja 1 ajatteli, että pelaaja 2 pysyy hiljaa, hänellä olisi kannustin räntää hänet pois sen sijaan, että hän vaietaisi, ja päinvastoin.

Tästä syystä Nash-tasapainoa voidaan pitää myös lopputuloksena, jossa yhdelläkään pelaajalla ei ole kannustinta yksipuolisesti (ts. Itse) poiketa strategiasta, joka johti siihen lopputulokseen. Yllä olevassa esimerkissä, kun pelaajat päättävät tunnustaa, kumpikaan pelaaja ei voi tehdä paremmin muuttamalla mieltään itse.