Prisen på stabilitet ( engelsk price of stability , PoS) for spillet er forholdet mellem den optimale værdi af den objektive funktion i en af dens ligevægtstilstande og det optimale resultat. Prisen på stabilitet giver mening for spil, der har en højere styrke eller spilbetingelser, der påvirker spillernes position på en eller anden måde og kan hjælpe dem med at konvergere til Nash-ligevægten . Når man måler effektiviteten af Nash-ligevægten i ethvert spil, giver det mening at overveje prisen på anarki ( Eng. Price of Anarchy , PoA).
PoS kan udtrykkes som følger:
Her er værdien af den bedste Nash-ligevægt og er værdien af den optimale løsning.
I Prisoner 's Dilemma -spillet nedenfor vil spillerne ikke altid samarbejde med hinanden, selvom det er i deres bedste interesse, da der kun er én ligevægt ( , ), vi har .
(2.2) | (0,3) | |
(3,0) | (1.1) |
Dette eksempel er en version af kampen mellem kønnene . Den har to ligevægtspunkter, ( , ) og ( , ) med henholdsvis værdierne 3 og 15. Den optimale værdi er 15. Så mens .
(2.1) | (0,0) | |
(0,0) | (5,10) |
Prisen på stabilitet blev først studeret af A. Shultzan og N. Mozes, og selve udtrykket optrådte i E. Anshelevichs værker. De viste, at Nash-ligevægten altid eksisterer i rene strategier, og stabilitetsomkostningerne for dette spil overstiger ikke det n'te harmoniske tal i rettede grafer. For urettede grafer præsenterede Anshelevich et al. en hård stabilitetsgrænse på 4/3 for tilfældet med én kilde og to spillere. Yen Lee beviste, at for sådanne grafer med forskellige destinationer for alle spillere, som alle spillere skal have forbindelse til, er prisen for et stabilt spilflow for at opbygge et Shapley-netværk, hvor antallet af spillere er. På den anden side er omkostningerne ved anarki for spillet ca.
Netværksopbygningsspil har en naturlig begrundelse for prisen på stabilitet. I disse spil kan prisen på anarki være meget mindre end prisen på stabilitet.
Et eksempel på følgende spil:
Prisen for anarki kan være . Et eksempel på følgende netværksopbygningsspil.
Der er 2 forskellige balancer i dette spil. Hvis alle deler buen , så er de sociale omkostninger . Desuden er denne balance optimal. Dog er opdelingen af alle buer også en Nash-ligevægt. Enhver agent har en pris i ligevægtsstrategien, og hvis den skiftes til en anden bue, hæves prisen til .
Her er et patologisk spil med samme adfærd, men til prisen for stabilitet. Der er spillere, som hver starter i toppen og forsøger at forbinde den til toppen . Lad os sige, at priserne på umærkede buer er 0.
Den optimale strategi for alle spillere er at dele buen , hvilket resulterer i en social omkostning . Der er dog kun én Nash-ligevægtsstrategi for dette spil. I tilfælde af optimalitet betaler hver spiller, og spiller 1 kan reducere sin pris ved at skifte til buen . Hvis dette sker, bliver det rentabelt for spiller 2 at skifte til buen , og så videre. Til sidst vil agenterne nå en Nash-ligevægt ved at betale deres egen separate bue. En sådan fordeling har en social omkostning , hvor er det th harmoniske tal , som er lig med . Selvom denne værdi ikke er begrænset, er omkostningerne ved stabilitet eksponentielt bedre end omkostningerne ved anarki i dette spil.
Per definition er netværksopbygningsspil overløbsspil , så de tillader en potentiel funktion .
Sætning. [Sætning 19.13 fra bog 1] Antag, at der er konstanter og sådan for enhver strategi
Så er prisen på stabilitet mindre
Bevis. Funktionens globale minimum er en Nash-ligevægt, således at
Den sociale pris blev defineret som summen af priserne over buerne, således at
Trivielt opnår vi og beregningerne ovenfor giver , så vi kan påberåbe os sætningen for den øvre grænse for stabilitetsomkostningerne.
Spilteori | |
---|---|
Basale koncepter | |
Typer af spil |
|
Løsningskoncepter | |
Eksempler på spil | |