Epsilon-ligevægt

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 13. juli 2017; checks kræver 3 redigeringer .
ε-ligevægt
Begrebet beslutning i spilteori
Relaterede beslutningssæt
Undersæt Nash ligevægt
Data
Ansøgning Stokastiske spil

En ε-ligevægt i spilteori  er en strategiprofil for spillere i et ikke-samarbejdsspil, der tilnærmelsesvis opfylder Nash-ligevægtsbetingelserne .

Definition

For et givet ikke-samarbejdsspil og en ikke-negativ reel parameter ε, kaldes strategiprofilen en ε-ligevægt, hvis ingen spiller kan øge sin forventede udbetaling med mere end ε ved at ændre sin strategi. Enhver Nash-ligevægt er en ε-ligevægt for ε = 0.

Formelt, lad være  et spil af N personer med sæt af strategier af spillere og en vektor af payoff funktioner u . Et sæt strategier er en -ligevægt i et spil G , hvis:

for alle

Eksempel

Begrebet ε-ligevægt bruges i teorien om stokastiske spil med et ubegrænset antal gentagelser. De følgende eksempler viser spil, der ikke har en Nash-ligevægt, men som har en ε-ligevægt for enhver positiv ε.

Det enkleste eksempel er den følgende version af spillet " Orlyanka ", foreslået af G. Everett. Spiller 1 vælger siden af ​​mønten, spiller 2 skal gætte den. Hvis spiller 2 gætter rigtigt, vinder han den mønt, og spillet slutter. Ellers, hvis "ørn" blev gættet, slutter spillet med nul gevinster, hvis " haler " blev gættet, gentages spillet. Når spillet gentages i det uendelige, modtager begge deltagere nul udbetalinger.

For enhver ε > 0 og en strategiprofil sådan, at spiller 2 kalder hoveder med sandsynlighed ε og hale med sandsynlighed 1-ε (på ethvert trin af spillet, uanset historien), er ε-ligevægten i dette spil. Den forventede gevinst for spiller 2 er ikke mindre end 1-ε. Det er dog let at se, at ingen af ​​Spiller 2s strategier kan garantere en forventet udbetaling på 1. Derfor har dette spil ikke en Nash-ligevægt.

Links

Litteratur