Fangens dilemma

Fangens dilemma ( eller mindre almindeligt kendt som bandittens dilemma ) er et grundlæggende problem i spilteorien , ifølge hvilket rationelle spillere ikke altid vil samarbejde med hinanden, selvom det er i deres bedste interesse. Det antages, at spilleren ("fangen") maksimerer sin egen udbetaling, uden at bekymre sig om andres fordele.

Essensen af problemet blev formuleret af Meryl Flood og Melvin Drescher i 1950. Navnet på dilemmaet blev givet af matematikeren Albert Tucker .

I Fangens Dilemma dominerer forræderi strengt samarbejdet, så den eneste mulige ligevægt er forræderi fra begge deltagere. Kort sagt, uanset opførsel af den anden spiller, vil hver drage mere fordel, hvis han forråder. Da det er bedre at forråde end at samarbejde i enhver situation, vil alle rationelle spillere vælge at forråde.

Ved at opføre sig individuelt rationelt kommer deltagerne sammen til en irrationel løsning: hvis begge forråder, vil de modtage en mindre samlet gevinst, end hvis de samarbejdede (den eneste ligevægt i dette spil fører ikke til en Pareto-optimal løsning). Deri ligger dilemmaet.

I det tilbagevendende fanges dilemma spilles spillet med jævne mellemrum, og hver spiller kan "straffe" den anden for ikke at samarbejde tidligere. I et sådant spil kan samarbejde blive en ligevægt, og incitamentet til at forråde kan opvejes af truslen om straf (i takt med at antallet af iterationer stiger, tenderer Nash-ligevægten til et Pareto-optimum ).

Det klassiske fangens dilemma

I alle retssystemer er straffen for banditri (begå forbrydelser som del af en organiseret gruppe) meget hårdere end for de samme forbrydelser begået alene (deraf navnet "bandittens dilemma").

Den klassiske formulering af fangens dilemma er:

To kriminelle - A og B - blev taget nogenlunde samtidig for lignende forbrydelser. Der er grund til at tro, at de handlede i samspil, og politiet, efter at have isoleret dem fra hinanden, tilbyder dem den samme aftale: Hvis den ene vidner mod den anden, og han forbliver tavs, så bliver den første løsladt for at hjælpe efterforskningen, og den anden modtager den maksimale fængselstid (10 år). Hvis begge er tavse, går deres handling under en lettere artikel, og hver af dem idømmes seks måneders fængsel. Hvis begge vidner mod hinanden, får de en minimumsstraf (2 år hver). Hver fange vælger, om han vil tie eller vidne mod den anden. Ingen af dem ved dog præcis, hvad den anden vil gøre. Hvad vil der ske?

Spillet kan repræsenteres som følgende tabel:

	Fange B forbliver tavs	Fange B vidner
Fange A forbliver tavs	Begge får seks måneder.	A får 10 år, B løslades
Fange A vidner	A løslades, B får 10 års fængsel	Begge får 2 års fængsel
Fangens dilemma i normal form .

Dilemmaet opstår, hvis vi antager, at begge kun bekymrer sig om at minimere deres egne fængselsstraffe.

Forestil dig ræsonnementet fra en af fangerne. Hvis partneren er tavs, så er det bedre at forråde ham og gå fri (ellers - seks måneders fængsel). Hvis en partner vidner, så er det bedre at vidne mod ham også for at få 2 år (ellers - 10 år) i fængsel. "Vidne"-strategien dominerer strengt "hold stille"-strategien. På samme måde kommer en anden fange til samme konklusion.

Fra gruppens (disse to fanger) synspunkt er det bedst at samarbejde med hinanden, tie og modtage seks måneder, da dette vil reducere den samlede fængselsperiode. Enhver anden løsning vil være mindre rentabel. Dette viser meget tydeligt, at i et ikke-nul sum-spil kan Pareto-optimum være det modsatte af Nash-ligevægten .

Generaliseret form

	Samarbejde	forråde
Samarbejde	C, C	c, D
forråde	D, c	d, d
The Canonical Payoff Matrix of Prisoner's Dilemma

Du kan udvide spillets skema yderligere ved at abstrahere fra fangernes undertekst. En generaliseret form for spillet bruges ofte i eksperimentel økonomi . Følgende regler giver en typisk implementering af spillet:

Spillet består af to spillere og en bankmand . Hver spiller har 2 kort: det ene siger "samarbejde", det andet siger "forråd" (dette er standardterminologien i spillet). Hver spiller placerer et kort med billedsiden nedad foran banken (dvs. ingen kender den andens løsning, selvom det ikke påvirker dominansanalysen at kende den andens løsning [1] ). Bankmanden åbner kortene og udbetaler gevinsten.
Hvis begge vælger "samarbejde", får begge et C. Hvis den ene vælger "forråde", "samarbejder", får den første et D, det andet et c. Hvis begge vælger "forråd" - får begge d.
Værdierne af variablerne C, D, c, d kan være af ethvert tegn (i eksemplet ovenfor er alt mindre end eller lig med 0). Uligheden D > C > d > c skal nødvendigvis overholdes, for at spillet kan være et “fangedilemma”.
Hvis spillet gentages, dvs. spilles mere end 1 gang i træk, bør den samlede gevinst ved samarbejde være større end den samlede gevinst i en situation, hvor den ene forråder, og den anden ikke gør det, dvs. 2C > D + c . Denne ulighed antyder, at der i tilfælde af gensidigt samarbejde opnås et strengt Pareto-optimum - en situation, hvor ethvert alternativ fører til et fald i udbetalingen for mindst én spiller.

Disse regler blev etableret af Douglas Hofstadter og danner den kanoniske beskrivelse af den typiske fanges dilemma.

Alternativ formulering

Hofstadter [2] foreslog, at folk lettere forstår problemer som Prisoner's Dilemma, når de præsenteres som et selvstændigt spil eller handelsproces. Et eksempel er "udveksling af lukkede poser":

To mennesker mødes og udveksler lukkede tasker, idet de indser, at en af dem indeholder penge, den anden - varer. Hver spiller kan respektere aftalen og lægge det, de er blevet enige om, i posen, eller bedrage partneren ved at give en tom pose.

I dette spil vil snyd altid være løsningen med den højeste kortsigtede materielle gevinst.

Eksempler fra det virkelige liv

Nogle spilshows bruger et lignende princip til at afgøre vinderne af enten runden eller finalen. Et eksempel på dilemmaet blev vist i 2012 i det britiske gameshow The Bank Job ved finalen i hver sæson: De to spillere, der kom til finalen, skulle beslutte, hvordan de skulle disponere over gevinsterne. Halvdelen af den samlede jackpot, der blev spillet, var i kufferter mærket CASH, de to andre var avisudklip mærket TRASH (spilleren har en kuffert af hver type). Hver spiller skulle tage en af deres kufferter og give den til den anden. Hvis begge spillere modtog kufferter med KONTANT, så delte de gevinsten i halve. Hvis man gav kufferten til TRASH, så tog han hele spillets bank. Hvis begge gav TRASH, stod begge tilbage uden penge, og gevinsten gik til de spillere, der droppede ud i de foregående faser af finalen.

Eksemplerne på fanger, kortspillet og udvekslingen af lukkede tasker kan virke langt ude, men faktisk er der mange eksempler på menneske-dyr-interaktioner, der har samme udbyttematrix. Derfor er fangens dilemma af interesse for samfundsvidenskaber som økonomi , statskundskab og sociologi , samt dele af biologi - etologi og evolutionsbiologi . Mange naturlige processer er blevet generaliseret til modeller, hvor levende væsener deltager i endeløse fanges dilemma-lignende spil. Denne brede anvendelighed af dilemmaet gør dette spil af stor betydning.

I politisk realisme , for eksempel, bruges dilemma-scenariet ofte til at illustrere problemet med to stater involveret i et våbenkapløb . Begge stater vil erklære, at de har to muligheder: enten øge militærudgifter eller reducere oprustning. I dette tilfælde er postulaterne om fangens dilemma (D > C > d > c) [3] åbenlyst opfyldt :

D - "vi er bevæbnet, men fjenden er det ikke" - det bedste resultat, den største sikkerhed;
C - "ingen bevæbnet" - det næste foretrukne resultat;
d - "bevæbnede" - dårligt, men ikke katastrofalt;
c - "vi bevæbnede os ikke, men fjenden bevæbnede sig" - et katastrofalt resultat.

Fra side A's synspunkt, hvis side B ikke armerer, så er valget for A mellem D og C - det er bedre at armere. Hvis B tilkobler, så er valget for A mellem d og c - igen er det mere rentabelt at tilkoble. For ethvert valg af B er det således mere rentabelt for side A at armere. Situationen for side B er nøjagtig den samme, og begge sider vil i sidste ende søge militær ekspansion .

William Poundstone beskriver i sin bog om fangens dilemma en situation i New Zealand , hvor aviskasser efterlades åbne. Det er muligt at tage en avis uden at betale for den, men det er de færreste, der gør det, for de fleste er klar over, hvilken skade det ville være, hvis alle stjal aviser. Da fangens dilemma i sin reneste form er samtidig for alle spillere (ingen kan påvirke andres beslutninger), kaldes denne fælles tankegang " magisk tænkning ". Som en forklaring på manglen på småtyveri forklarer magisk tænkning frivillig afstemning ved valg (hvor ikke-vælgeren betragtes som en hare ). Alternativt kan denne adfærd forklares med forventningen om fremtidige handlinger (og kræver ikke forbindelse med "magisk tænkning"). Modellering af fremtidige handlinger kræver tilføjelse af en tidsdimension, hvilket gøres i et tilbagevendende dilemma.

Den teoretiske konklusion på dilemmaet er en af grundene til , at anbringende forhandlinger er forbudt i mange lande . Ofte gentages scenariet med dilemmaet meget præcist: Det er i begge mistænktes interesse at tilstå og vidne mod den anden mistænkte, selvom begge er uskyldige. Måske er det værste tilfælde, når kun én er skyldig, i hvilket tilfælde det er usandsynligt, at den uskyldige vil tilstå noget, og den skyldige vil gå videre og vidne mod den uskyldige.

Mange dilemmaer fra det virkelige liv involverer flere spillere. Selvom det er metaforisk, kan Hardins " tragedy of the commons " ses som en generalisering af dilemmaet for flere spillere. Hver beboer i samfundet vælger, om de vil græsse kvæg på en fælles græsgang og drage fordel ved at udtømme deres ressourcer , eller at begrænse deres indkomst. Det kollektive resultat af den generelle (eller hyppige) maksimale udnyttelse af græsningen er lav indkomst (der fører til ødelæggelse af samfundet). Sådan et spil er dog ikke formelt, da det kan opdeles i en sekvens af klassiske 2-spiller spil.

Den tilbagevendende fanges dilemma

I bogen The Evolution of Cooperation fra 1984 udforskede Robert Axelrod en udvidelse af dilemma-scenariet, som han kaldte Repetitive Prisoner's Dilemma (RPD). I den træffer deltagerne valg igen og igen og husker tidligere resultater. Axelrod inviterede akademiske kolleger fra hele verden til at udvikle computerstrategier for at konkurrere i PDD-mesterskabet. Programmerne inkluderet i det varierede i algoritmisk kompleksitet, indledende fjendtlighed, evne til at tilgive og så videre.

Axelrod opdagede, at hvis spillet blev gentaget i lang tid blandt mange spillere, hver med forskellige strategier, klarede "grådige" strategier sig dårligt i det lange løb, mens mere " altruistiske " strategier klarede sig bedre ud fra et egeninteressesynspunkt. Han brugte dette til at vise en mulig mekanisme for udviklingen af altruistisk adfærd fra mekanismer, der oprindeligt er rent egoistiske , gennem naturlig udvælgelse .

Den bedste deterministiske strategi var Tit for Tat , som blev udviklet og stillet op til mesterskabet af Anatoly Rapoport . Det var det enkleste af alle de deltagende programmer, der kun bestod af 4 linjer BASIC -kode . Strategien er enkel: samarbejde om den første iteration af spillet, hvorefter spilleren gør det samme, som modstanderen gjorde i det foregående trin. "Tit for an Tat with Forgiveness"-strategien fungerer lidt bedre. Når en modstander forråder, i det næste trin, samarbejder spilleren nogle gange, uanset det forrige trin, med en lille sandsynlighed (1-5%). Dette giver dig mulighed for tilfældigt at forlade cyklussen af gensidigt forræderi. Det fungerer bedst, når fejlkommunikation introduceres i spillet - når en spillers beslutning bliver kommunikeret til en anden ved en fejl.

Ved at analysere de strategier, der scorede de bedste resultater, nævnte Axelrod flere betingelser, der er nødvendige for, at strategien kan opnå et højt resultat:

Venlig. Den vigtigste betingelse er, at strategien skal være "god", det vil sige ikke forråde, før modstanderen gør det. Næsten alle førende strategier var gode. Derfor vil en rent egoistisk strategi, af rent egoistiske årsager, ikke være den første til at "slå" modstanderen.
Hævnlysten. En succesfuld strategi behøver ikke at være en blind optimist. Hun skal altid tage hævn. Et eksempel på en tilgivende strategi er altid at samarbejde. Dette er et meget dårligt valg, da "mene" strategier vil drage fordel af det.
Tilgivende. En anden vigtig kvalitet ved succesfulde strategier er at kunne tilgive. Efter at have hævnet sig, skal de vende tilbage til samarbejdet, hvis modstanderen ikke fortsætter med at forråde. Dette forhindrer endeløse gengældelsesaktioner mod hinanden og maksimerer gevinsterne.
Ikke misundelig. Den sidste kvalitet er ikke at være misundelig, det vil sige ikke at forsøge at score flere point end din modstander.

Således kom Axelrod til den utopiske konklusion, at egoistiske individer til deres eget egoistiske bedste ville stræbe efter at være venlige, tilgivende og ikke-misundelige.

Overvej igen våbenkapløbsmodellen. Det blev konkluderet, at den eneste rationelle strategi er at bevæbne, selvom begge lande gerne vil bruge deres BNP på olie frem for våben [4] . Interessant nok viser forsøg på at demonstrere, at dilemmaslutning virker i praksis (ved at lave en analyse af "høje" og "lave" militærudgifter mellem perioder, baseret på antagelserne fra TPP) ofte, at denne adfærd ikke forekommer (f.eks. græsk og Tyrkiske militærudgifter ændres ikke i overensstemmelse med strategien "øje for øje", men følger højst sandsynligt en intern politik). Dette kan være et eksempel på rationel adfærd forskellig fra one-shot og multi-move spil.

Hvis forræderistrategien under alle omstændigheder dominerer i et et-træks-spil, så afhænger den optimale strategi i et multi-move-spil af andre deltageres adfærd. For eksempel, hvis alle i befolkningen er hinanden utro, og man opfører sig efter princippet om "øje for øje", er han på et lille tab på grund af tabet ved første træk. I sådan en befolkning er den optimale strategi altid at forråde. Hvis antallet af dem, der bekender sig til princippet om "øje for øje", er større, så afhænger resultatet allerede af deres andel i samfundet.

Der er to måder at bestemme den optimale strategi på:

Bayes-Nash ligevægt: hvis den statistiske fordeling af den oplevede adfærd bestemmes (for eksempel 33 % tit for tat, 33 % snyder altid og 33 % samarbejder altid), så kan strategien beregnes matematisk [5] . Dette behandles i detaljer af teorien om evolutionær dynamik ;
ved hjælp af Monte Carlo-metoden blev der lavet simuleringer af populationer, hvor individer med lave resultater døde ud, og dem med høje resultater reproducerede (en genetisk algoritme blev brugt til at søge efter den optimale evolutionært stabile strategi ). Strukturen af adfærd i den endelige population afhænger af strukturen i begyndelsen.

Selvom tit-for-tat-strategien blev betragtet som den mest succesrige simple strategi, præsenterede et hold fra University of Southampton ledet af professor Nicholas Jennings [6] en ny strategi til 20-årsdagen for PKD-mesterskabet. Denne strategi har været mere vellykket end tit-for-tat. Den var afhængig af interaktionen mellem programmerne for at få den maksimale score for et af dem. Universitetet opstillede 60 programmer til mesterskabet, som genkendte hinanden ved en række handlinger i de første 5-10 træk. Efter at have genkendt det andet, samarbejdede det ene program altid, mens det andet forrådte, hvilket gav maksimalt point til forræderen. Hvis programmet forstod, at modstanderen ikke var fra Southampton, ville det fortsætte med at forråde ham hele tiden for at minimere modstanderens resultat. Som et resultat [7] tog denne strategi de tre første pladser i konkurrencen, samt flere pladser i træk nedenfor.

Selvom denne evolutionært stabile strategi viste sig at være mere effektiv i konkurrencen, blev dette opnået på bekostning af at tillade flere agenter at deltage i den pågældende konkurrence. Hvis spilleren kun kan kontrollere én agent, er tit for tat det bedste. Hun overholder også reglen om ingen kommunikation mellem spillere. Det faktum, at Southampton-programmerne udførte en "rituel dans" i de første 10 omgange for at lære hinanden at kende, bekræfter kun, hvor vigtig kommunikation er for at flytte balancen i spillet.

Hvis PDZ afspilles nøjagtig N gange (en eller anden kendt konstant N), er der en anden interessant kendsgerning. Nash-ligevægten er altid at forråde. Vi beviser ved induktion: Hvis begge samarbejder, er det rentabelt at forråde det sidste træk, så vil modstanderen ikke have mulighed for at tage hævn. Derfor vil begge forråde hinanden i sidste træk. Da modstanderen under alle omstændigheder vil forråde det sidste træk, vil enhver spiller ønske at forråde på det næstsidste træk, og så videre. For at samarbejdet forbliver rentabelt, skal fremtiden være usikker for begge aktører. En løsning er at gøre tallet N tilfældigt og beregne resultaterne ved den gennemsnitlige udbetaling pr. tur.

Fangens dilemma er grundlæggende for nogle teorier om menneskelig interaktion og tillid. Ud fra dilemmamodellens antagelse om, at en transaktion mellem to personer kræver tillid, kan tillidsadfærd i populationer modelleres ved hjælp af en multiplayer iterativ version af spillet. Dette har inspireret mange videnskabsmænd i årevis. I 1975 anslog Grofman og Poole antallet af artikler, der var afsat til dette emne, til omkring 2000.

Læringspsykologi og spilteori

Hvis spillere kan vurdere muligheden for forræderi fra andre spillere, er deres adfærd påvirket af erfaring. Simple statistik viser, at uerfarne spillere normalt opfører sig overdrevent godt eller dårligt. Hvis de opfører sig sådan hele tiden, vil de tabe, fordi de er for aggressive eller for venlige. Efterhånden som de får mere erfaring, vurderer de mere realistisk sandsynligheden for forræderi og opnår bedre resultater. Tidlige spil har en stærkere effekt på uerfarne spillere end senere spil på erfarne. Dette er et eksempel på, hvorfor tidlige oplevelser har så stor indflydelse på de unge, og hvorfor de er særligt sårbare over for umotiveret aggression, nogle gange selv bliver det samme.

Det er muligt at reducere sandsynligheden for forræderi i en befolkning gennem samarbejde i tidlige spil, hvilket gør det muligt at opbygge tillid [8] . Derfor kan selvopofrelse i nogle situationer booste gruppemoralen. Hvis gruppen er lille, er der større sandsynlighed for, at positiv adfærd bliver gengældt, hvilket vil tilskynde individer til at samarbejde yderligere. Dette hænger sammen med et andet dilemma, at det at blive behandlet godt uden grund er nydelse, der kan forringe ens moralske karakter.

Disse processer er hovedinteressefeltet inden for gensidig altruisme , gruppeudvælgelse , familieudvælgelse og etik .

Religions indflydelse

Religiøse forestillinger øger graden af samarbejde mellem spillere markant. I undersøgelser førte selv den implicitte omtale af religiøse ord i den indledende opgave før spillet til en signifikant stigning i prosocial adfærd [9] .

Se også

Noter

↑ Hint om, at den røde spiller for eksempel skal spille "samarbejde", ændrer ikke det faktum, at "forråd" er en strengt dominerende strategi. Hvis vi kun betragter spillet, spiller muligheden for kommunikation ingen rolle. Men hvis spillet bliver spillet i det virkelige liv, kan overvejelser uden for selve spillet forårsage samarbejde. Dette er en meget vigtig pointe i spillets konklusion, at hvis vi ikke behøver at tage hensyn til uvedkommende faktorer, ændrer det engangs "fanges dilemma" sig ikke fra kommunikation.
↑ Hofstadter, Douglas . Kapitel 29 // Metamagiske temaer: søgen efter essensen af sind og mønster. - Bantam Dell Pub Group, 1985. - ISBN 0-465-04566-9 .
↑ Genie Baker. The Harmony of Interests Revisited Arkiveret 12. juni 2010 på Wayback Machine . // Markedsrealisme: Differentielt risikable valutaer og gevinsterne ved handel under den liberale økonomiske orden. (Engelsk)
↑ I økonomiske lærebøger er produktionsmulighederskurven illustreret ved et valg mellem blot to varer: olie og våben.
↑ "Bayes-Nash ligevægt; statistisk test af hypotesen" Arkiveret 2. oktober 2005.
↑ Professor Nick Jennings Arkiveret 10. april 2006 på Wayback Machine
↑ Prisoner's Dilemma Tournament 2004 Resultater arkiveret 29. august 2006 på Wayback Machine viser, at University of Southampton-holdet sluttede på de tre bedste pladser, selvom de havde færre sejre end GRIM-strategien (turneringen behøvede ikke at vinde individuelle kampe; det ' s opnåeligt og simpelt hyppigt forræderi). Og uden det underforståede samarbejde mellem strategier, som Southampton-holdet har misbrugt, er tit for tat ikke altid den direkte vinder af enhver konkurrence. Med andre ord vil den i det lange løb i en række forskellige mesterskaber præstere bedre end rivalerne, og i et enkelt mesterskab kan strategien tilpasses lidt bedre til konkurrencen end "tit for tat". Det samme gælder OZO med tilgivelse: I en enkelt konkurrence kan den tabe til særligt skærpede strategier. Et alternativ er at bruge evolutionssimulering . I den vil OZO komme til at dominere, og onde strategier vil dukke op og forsvinde fra befolkningen fra tid til anden. Richard Dawkins viste, at der ikke er nogen statisk kombination af strategier, der ville være en stabil ligevægt, og systemet vil svinge mellem grænser.
↑ Et argument om udviklingen af samarbejde gennem tillid er givet i bogen Wisdom of the Crowds af James Surowiecki , som hævder, at kapitalismen i det lange løb var i stand til at organisere sig omkring en kerne af kvækere , der altid arbejdede ærligt med deres partnere ( i stedet for at bedrage og bryde løfter - et fænomen, der stoppede tidligere langvarige frivillige internationale kontakter).[ præciser ] Det hævdes, at omgang med troværdige købmænd gjorde det muligt for en kultur af ærlighed (samarbejde) at sprede sig til andre købmænd, som spredte den videre, indtil det overhovedet var rentabelt at være ærlig.
↑ Ali M. Ahmed, Osvaldo Salas. Implicit indflydelse fra kristne religiøse repræsentationer på diktator og fangers dilemma spilbeslutninger // The Journal of Socio-Economics. - 2011-05-01. - T. 40 , nej. 3 . — S. 242–246 . - doi : 10.1016/j.socec.2010.12.013 . Arkiveret fra originalen den 25. august 2011.

Litteratur

Axelrod, Robert og Hamilton, William D. (1981). "Udviklingen af samarbejde". Science , 211: 1390-1396.
The Evolution of Collaboration , Robert Axelrod , Basic Books , ISBN 0-465-02121-2
Axelrod, Robert (1997). Samarbejdets kompleksitet . Princeton University Press . ISBN 0-691-01567-8 .
The Selfish Gene , Richard Dawkins (1990), ISBN 0-19-286092-5
Grofman og Pool (1975). "Bayesianske modeller for itererede fanges dilemmaspil " . General Systems 20: 185-94.
Hardin, Garrett (1968). "The Tragedie of Commons" . Science , 162: 1243-1248.
Kreps, David, Robert Wilson, Paul Milgrom og John Roberts (1982). "Rationelt samarbejde i det endeligt gentagne fangers dilemma." Journal of Economic Theory 27(2): 245-52.
Milgrom, Paul (1984). Axelrods The Evolution of Cooperation. Rand Journal of Economics 15(2): 30-59.
Poundstone, William (1992). Prisoner's Dilemma: John von Neumann, Game Theory, and the Puzzle of the Bomb . Dobbeltdag . ISBN 0-385-41567-2 .
Rapoport, Anatol og Chammah, Albert M. (1965). Fangens dilemma . University of Michigan Press.
Verhoeff, Tom (1998). "The Trader's Dilemma: A Continuous Version of the Prisoner's Dilemma" . Computing Science Notes 93/02
New Tack vinder Prisoner's Dilemma

Links

Ordbøger og encyklopædier

I bibliografiske kataloger
BNE : XX550497 BNF : 12526229f GND : 4139587-6 J9U : 987007536357305171 LCCN : sh85106969 SUDOC : 034513272 , 191210293

Spilteori
Basale koncepter	Gensidig og fælles viden Spiller Hierarki af trosretninger Irrationel forstærkning Strategi ( dominans ) Omvendt induktion
Typer af spil	Samtidig , sekventiel og gentagne Ikke -samarbejdsvillig og samarbejdsvillig Med fuldstændig , ufuldstændig , perfekt og ufuldkommen information I normal og udvidet form Antagonistisk Differential Stokastisk Kønnenes kamp Hjortejagt
Løsningskoncepter	Risiko dominans Korreleret ligevægt Balancen af en skælvende hånd Nash ligevægt Subgame perfekt ligevægt Rationaliseringsevne Sekventiel ligevægt stærk balance Egen balance Evolutionært stabil strategi Epsilon-ligevægt Pareto effektivitet Nucleus
Eksempler på spil	Fangens dilemma Barens opgave "El Farol" Bertrand model Cournot model Stackelberg model Orlyanka Tragedien med delte ressourcer høge og duer
Epistemisk spilteori Mekanisme design Fair opdeling

Beslutningsteoriens paradokser
Buridans æsel Morton stik stemme pindsvin fange opfinder navigation nye stater forebyggelse beslutningstagning detailnetværk viljestyrke toksin tolerance Abilene Grøn Condorcet Newcomb parrondo Fenno Fredkin Ellsberg Pil