Minimax - Hva er det, definisjon og konsept

Innholdsfortegnelse:

Minimax - Hva er det, definisjon og konsept
Minimax - Hva er det, definisjon og konsept
Anonim

Minimaks, i spillteori, er en metode som tar sikte på å minimere forventet tap. For å gjøre dette antar spilleren at avgjørelsen hans motstander tar vil være ugunstig. Det vil si at det verste scenariet forventes før motstanderens bevegelse.

For å si det på en annen måte, består minimax-metoden av hvordan du tar den beste avgjørelsen forutsatt at den andre spilleren velger det verste fallsscenariet for deg.

Vi må ta i betraktning at denne metoden kan brukes i et spill for to personer (to spillere) og at det ikke er samarbeidsvillig, men et nullsumsspill. Dette betyr at det som en spiller vinner, er tapt av den andre og omvendt. Derfor vil hver agent være interessert i å maksimere sitt eget verktøy, selv om det skader den andre.

På dette punktet må vi også huske at spillteori er en gren av matematikk og økonomi som studerer valg som optimaliserer situasjonen til et individ når kostnader og fordeler ikke er løst på forhånd, men avhenger av andres beslutninger.

Minimax-algoritme i et beslutningstreet

Vi kan se hvordan minimax-metoden brukes i et beslutningstre med flere noder. Spillet starter nederst og slutter med et resultat på øverste nivå.

Ved foten av treet gjør motstanderen det første trekket, så det verste resultatet forventes. Så, på andre nivå, er det opp til spiller x som vil søke å maksimere profitten sin, med tanke på avgjørelsen som tidligere ble tatt av motstanderen.

På tredje nivå er det igjen motstanderens tur og så videre. Vi viser et eksempel nedenfor.

Minimax-algoritmeeksempel

I det følgende beslutningstreet viser vi resultatene som oppnås av spiller x i hvert øyeblikk av spillet. På basen, på første nivå, tar motstanderen avgjørelsen. Av den grunn er scenariene gitt der spilleren kan tape -10 eller vinne 5.

På andre nivå er det opp til spiller x, så han maksimerer fortjenesten. Mellom å tape 10 eller vinne 1, vil du vinne 1. På samme måte, mellom å vinne 5 eller 7, vil du vinne 7.

Deretter er det motstanderens tur igjen, så scenariene vil bli gitt hvor spiller x har dårligst resultat, -3 og 4, avhengig av tilfelle. Til slutt, mellom å tape 3 eller å vinne 4, vil spiller x ta avgjørelsen som tillater sistnevnte.

Vi må ta i betraktning at verdiene til hver node vil avhenge av en verktøyfunksjon.

For å forstå treet bedre, anta at beslutningen i utgangspunktet handler om distribusjon av produktet. Konkurrenten (motstanderen) kan outsource distribusjonen (se venstre side av treet). I så fall må han for eksempel velge mellom forhandler A og B. Dermed velger han førstnevnte, slik at spiller x mister 10 (Hvis han valgte B, ville spiller x vinne 12).

Imidlertid foretrekker kanskje motstanderen å distribuere varene sine selv, ved å kunne leie motoriserte kjøretøy eller kjøpe en lastebil. Av begge scenariene, velg den første som er mindre smigrende for spiller x fordi han vinner 5 og ikke 10.