Nash Equilibrium - Hva er det, definisjon og konsept

Innholdsfortegnelse:

Anonim

Nash-likevekt er en situasjon der enkeltpersoner eller spillere ikke har noe incentiv til å endre sin strategi med tanke på avgjørelsene til motstanderne.

I Nash-likevekt er strategien valgt av hver av deltakerne i en konflikt eller et spill optimalt, gitt strategien valgt av de andre. Med andre ord, ingen vil tjene noe hvis de bestemmer seg for å endre sin strategi under forutsetning av at andre individer ikke endrer sin.

Det bør bemerkes at under Nash-likevekten oppnås ikke nødvendigvis den største gevinsten for alle individer eller spillere sammen. Det er bare sant at hver enkelt reagerer optimalt på de andres strategi. I mange tilfeller ønsker enkeltpersoner å være i stand til å oppnå en annen likevekt med høyere fortjeneste, men ikke klarer det fordi de står i fare for å bli forrådt.

Opprinnelsen til konseptet

Nash-likevekten er et begrep som tilhører spillteorien, en gren av økonomien som studerer matematiske modeller for konflikt og samarbeid mellom antatt rasjonelle individer.

Skaperen av konseptet er matematikeren John Nash som i 1951 klarte å demonstrere at i hvert spill der deltakerne kan velge mellom et endelig antall strategier (som kan være rene eller blandede) vil det alltid være minst en Nash-likevekt.

Fangens dilemma

Det kanskje mest kjente eksemplet på Nash-likevekt er det som forekommer i spillet kalt "fangens dilemma." Vi forklarer det nedenfor.

Anta at det er to fanger A og B som begikk et væpnet ran. Politiet har arrestert dem, men krever mer bevis for å kunne fengsle dem. For mer informasjon låser de dem i to separate celler, slik at de ikke kan kommunisere med hverandre og presentere dem for følgende forhold:

  1. Hvis du tilstår, men partneren din ikke, vil vi løslate deg mens vi gir partneren din 10 års fengsel.
  2. Hvis vi ser at de begge tilstår, vil vi gi hver av dem 5 år.
  3. Hvis ingen av oss tilstår, vil vi gi hver av dem ett år i fengsel.

Vi kan tegne denne situasjonen gjennom et spill som vi representerer ved hjelp av en utbetalingsmatrise der hvert år i fengsel har en negativ verdi.

Spiller A / B

Å tilstå

Ikke tilstå

Å tilstå

-5; -5

0; -10

Ikke tilstå

-10; 0

-1; -1

I dette spillet er Nash-likevekten Confess-Confess, siden ingen av spillerne har et insentiv til å endre avgjørelsen med tanke på hva partneren deres vil gjøre. Imidlertid foretrekker begge individer å plassere seg i en annen likevekt (Ikke tilstå-ikke tilstå).

Til tross for det ovennevnte, når forholdene i spillet endres (for eksempel en uendelig repetisjon), er det mulig å nå andre likevekter.