Nash ligevægt

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 9. september 2020; checks kræver 11 redigeringer .
Nash ligevægt
Begrebet beslutning i spilteori
Relaterede beslutningssæt
Supersæt Rationaliserbarhed
Korreleret ligevægt
ε-ligevægt
Undersæt Underspil perfekt
ligevægt Rystende hånd ligevægt
Evolutionært stabil strategi
Stærk ligevægt
Data
Forfatterskab John Nash
Ansøgning Alle ikke-samarbejdsspil

Nash-ligevægt  er begrebet beslutning , et af spilteoriens nøglebegreber . Dette er navnet på et sæt strategier i et spil for to eller flere spillere, hvor ingen deltager kan øge udbyttet ved at ændre sin strategi, hvis de andre deltagere ikke ændrer deres strategier [1] . John Nash beviste eksistensen af ​​en sådan ligevægt i blandede strategier i ethvert begrænset spil.

Historie

Dette koncept blev først brugt af Antoine Auguste Cournot . Han viste, hvordan man finder det, vi kalder Nash-ligevægten i Cournot-spillet . Nash var den første til at bevise, at en sådan ligevægt skal eksistere for alle endelige spil med et hvilket som helst antal spillere. Dette blev gjort i hans afhandling om ikke-samarbejdsspil i 1950.

Før Nash blev dette kun bevist for 2-spillers nulsumsspil af John von Neumann og Oskar Morgenstern (1947).

Matematisk formulering

Antag, at det  er et ikke-samarbejdsvilligt n - player spil i normal form, hvor S  er sættet af rene strategier, og H  er sættet af gevinster. Når hver spiller vælger en strategi i strategiprofilen, vinder spiller i Bemærk, at udbetalingen afhænger af hele strategiprofilen: ikke kun af den strategi , som spiller i har valgt , men også af andre strategier , det vil sige alle strategier for . Strategiprofilen er en Nash-ligevægt, hvis ændring af dens strategi fra til ikke er rentabel for nogen spiller , dvs.

Et spil kan have en Nash-ligevægt i rene strategier eller i blandede strategier (det vil sige at vælge en ren strategi stokastisk ved en fast frekvens). Nash beviste, at hvis blandede strategier er tilladt, så vil der være mindst én Nash-ligevægt i hvert spil med n spillere.

Eksempler på brug af konceptet

Sociologi

I den sociologiske teori om rationelt valg understreges det særskilt, at samfundets stabile tilstand (social ligevægt) kan afvige fra den optimale (sociale optimum). Sådanne suboptimale, men stabile tilstande kaldes Nash-ligevægt i sociologien.

Skuespiller B
en 2
Skuespiller A en A: +1, B: +1 A: -1, B: +2
2 A: +2, B: -1 A: 0, B: 0

Tabellen til venstre viser handlingsstrukturen i form af spilteori , udarbejdet for to aktører ( aktører ). Hver aktør har to handlingsmuligheder, angivet med tallene 1 og 2. De belønningskoefficienter, de modtager, når de vælger bestemte handlingsmuligheder, er angivet i de tilsvarende celler i tabellen. Antag, at begge skuespillere i øjeblikket bruger handling 2, og deres belønninger er henholdsvis nul. Ved at vælge handling 1 vil aktør A forværre sin egen situation med én position (A: −1, B: +2). På samme måde vil skuespiller B, der vælger mulighed 1 alene, mens skuespiller A fortsætter med at bruge mulighed 2, kun forværre hans situation (A: +2, B: -1). På trods af at begge aktører forstår, at situationen ville være optimal for dem, når de begge bruger handling 1 (belønning - A: +1, B: +1), har ingen af ​​dem et motiv til at ændre situationen, og ligevægt skyldes fraværet af sådanne motiver. Hvis systemet allerede er i en optimal tilstand (når begge aktører har valgt handling 1), så vil de begge altid være fristet til at begynde at bruge handling 2, hvilket vil give dem en belønning på bekostning af den anden spiller. Dette eksempel illustrerer muligheden for to sociale tilstande: stabil, men suboptimal (begge aktører bruger mulighed 2); samt den anden optimale, men ustabile (begge aktører bruger mulighed 1). [2]

Statskundskab

For at forklare forskellige fænomener i politisk teori bruges ofte begrebet kerne , som er en svagere version af Nash-ligevægten. En kerne er et sæt af tilstande, hvor ingen gruppe af aktører, der er i stand til at opbygge en ny (fraværende i den givne kerne) tilstand, vil forbedre deres situation sammenlignet med deres tilstand i den givne kerne. [2]

Økonomi

Der er to firmaer nr. 1 og nr. 2 i branchen. Hver af firmaerne kan fastsætte to prisniveauer: "høj" og "lav". Hvis begge firmaer vælger høje priser, så vil hver få en fortjeneste på 3 millioner. Hvis begge vælger lave priser, vil hver især modtage 2 millioner. Men hvis den ene vælger høj og den anden lav, så vil den anden modtage 4 millioner, og den første kun 1 million Den mest fordelagtige variant i alt er det samtidige valg af høje priser (sum = 6 millioner). Imidlertid er denne tilstand (i mangel af et kartel ) ustabil på grund af muligheden for relativ gevinst, der åbner op for en virksomhed, der afviger fra denne strategi. Derfor er det mest sandsynligt, at begge virksomheder vælger lave priser. Selvom denne mulighed ikke giver den maksimale samlede gevinst (sum = 4 millioner), udelukker den den relative gevinst for konkurrenten, som han kunne opnå ved at afvige fra den gensidigt optimale strategi. Denne situation kaldes "Nash-ligevægt" [3] .

I Stackelberg-oligopolmodellen kan det for to firmaer, der deltager i et ikke-samarbejdsspil, antages, at der er to strategier: 1. Cournot duopolist (K) og Stackelberg duopolist (S), det vil sige en S-strateg. Således er følgende strategier mulige for to spillere:

(K1;K2) (K1;S2);(K2;S1);(S1;S2). Som det følger af konstruktionen af ​​profitmodellen, når man vælger en strategi S: , og når man vælger en strategi K: , er det klart, at det maksimale udbytte af den første spiller realiseres i situationen (S1;K2), og den anden ( K1;S2). Da disse situationer er uforenelige, det vil sige, at de ikke kan realiseres samtidigt, kan begge spillere ikke få det maksimale udbytte på samme tid. I dette tilfælde vil den optimale adfærd for begge spillere være valget af strategi S, da strategi S i dette tilfælde er bedre end strategi K med hensyn til det mindst mulige udbytte. I dette tilfælde er valget (S1;S2) Nash-ligevægten. En ensidig afvigelse fra denne strategi reducerer automatisk udbetalingen for enhver af spillerne, mens den samlede udbetaling i denne type ligevægt er mindre end den samlede gevinst, når man vælger strategien (K1;K2) af begge spillere. Men under betingelserne i denne model, i mangel af informationsudveksling mellem spillerne, vil afvigelsen fra Nash-ligevægten ikke blive realiseret på grund af den øgede risiko for, at den anden spiller kan drage fordel af situationen og ikke vælge strategi K.

Krigsførelse

Begrebet gensidig sikret ødelæggelse . Ingen af ​​de parter, der er i besiddelse af atomvåben, kan enten starte en konflikt ustraffet eller afvæbne ensidigt.

Se også

Noter

  1. Univertv - Nash Equilibrium: Shopping, omdømme, afstemning Arkiveret 13. december 2009 på Wayback Machine .
  2. 1 2 James S. Coleman . Økonomisk sociologi set fra rationel valgteori  // Økonomisk sociologi: elektronisk tidsskrift. - 2004. - V. 5 , nr. 3 . - S. 35-44 .
  3. "Nashs Nobelpris" Arkiveret 26. maj 2015 på Wayback Machine , The Economist, 24. maj 2015.

Litteratur

  1. Vasin A. A. , Morozov  V. V. Spilteori og modeller for matematisk økonomi. - M.: MGU, 2005, 272 s. ISBN 5-317-01388-7 .
  2. Vorobyov N. N. Spilteori for kybernetikøkonomer. — M.: Nauka, 1985
  3. Mazalov VV Matematisk teori om spil og applikationer. - Lan Publishing House, 2010, 446 s.
  4. Petrosyan L. A. , Zenkevich N. A., Shevkoplyas E. V. Teoriya igr. - Skt. Petersborg: BHV-Petersburg, 2012, 432 s.