Häggström hävdar: Om spelteori

torsdag 15 december 2011

Om spelteori

Professor Adamsson har varje dag två lunchställen att välja mellan: Kåren och Finkrogen.¹ Att Finkrogen är aningen dyrare bekommer honom inte. Den enda faktor som är viktig för hans val är att han gärna vill äta lunch med professor Blom, som har samma två lunchställen att välja mellan. En lunch med den spirituelle professor Blom är för Adamsson dagens höjdpunkt, och ju längre lunchen med Blom drar ut på tiden desto bättre. Det hela skulle enkelt gå att lösa, t.ex. genom att Adamsson på förmiddagen ringer Blom och de kommer överens om var de skall mötas, om det inte vore för den lilla komplikationen att Blom har en helt annan syn på saken. Blom anser nämligen att Adamsson är en av de tristaste personer som gått i ett par skor, och han betraktar varje minut i Adamssons sällskap som en förlorad minut. Samtidigt är Blom såpass artig att han omöjligt kan svara med annat än ja när Adamsson kommer fram till hans lunchbord och frågar om han får slå sig ned. En lunch på Kåren tar 20 minuter, och en lunch på Finkrogen tar 50 minuter. Hur bör Adamsson välja lunchställe för att på bästa sätt maximera tiden ihop med Blom? Och hur bör Blom välja lunchställe för att minimera tiden ihop med Adamsson?

Fundera gärna på, och försök lösa, denna övningsuppgift i spelteori, innan du kikar på min diskussion i en fotnot här nedan.² Spelteori kan beskrivas som studiet av beslutsteoretiska situationer där en aktörs framgång beror inte bara på vilket beslut han eller hon själv fattar, utan också på en eller flera andra aktörers beslut (i exemplet ovan påverkas Adamssons framgång inte bara av vilket beslut han själv fattar rörande val av lunchrestaurang, utan även av Bloms motsvarande beslut). I ganska hög grad kan spelteori ses som en matematisk verksamhet eller rentav en gren av matematiken, men området har också omfattande och viktiga tillämpningar i ämnen som evolutionsbiologi, nationalekonomi och statsvetenskap.

Både för de matematiska inslagen och för dess tillämpningar finner jag spelteori vara ett oerhört fascinerande område. Mycket riktigt ägnade jag ett kapitel åt det i min bok Slumpens skördar från 2004. Bäst utredd är spelteorin i så kallade nollsummespel - dvs situationer med två parter där den enes vinst är den andres förlust, som i många kort- och brädspel, och i exemplet med professorerna Adamsson och Blom. Allra intressantast vill jag dock mena att spelteorin blir då nollsummeantagandet avskaffas, något som öppnar möjlighet för spelets aktörer att på ett eller annat vis söka samarbete. Kända - men långt ifrån färdigutredda - exempel på situationer där det finns starka incitament för varje enskild aktör att agera själviskt, men där alla skulle tjäna på om alla valde att samarbeta, går under namn som fångarnas dilemma och allmänningens tragedi. Speciellt den senare är höggradigt relevant för hur vi agerar i miljöfrågor: samarbeta genom att göra det bästa för allas vår miljö, eller köra på med stadsjeepen efter eget egoistiskt huvud och hoppas att andra tar bättre ansvar för det gemensamma.

En gren av spelteorin som visat sig särskilt fruktbar är så kallad evolutionär spelteori. Här tänker man sig en population av individer som interagerar med varandra enligt olika strategier (vissa individer är snälla, vissa är egoistiska, etc) och att förekomsten av olika strategier i populationen förändras i tiden på sådant sätt att de som är framgångsrika blir vanligare, på de mindre framgångsrika strategiernas bekostnad. I biologiska sammanhang är det naturligt att tänka sig att denna dynamik uppkommer genom Darwinsk selektion, medan det i vissa sammhällsvetenskapliga tillämpningar är naturligare att tänka sig att den uppstår genom att vissa individer väljer att imitera andra mer framgångsrika individers beteende. Även enkla modellantaganden kan leda till fascinerande dynamik. Österrikaren Karl Sigmund, som hör till pionjärerna inom evolutionär spelteori, utkom förra året med boken The Calculus of Selfishness. För den ambitiöse läsaren är boken en ypperlig introduktion till området. Den något mindre ambitiöse läsaren kan välja att nöja sig med att läsa min recension av boken i (det redan utkomna!) januarinumret 2012 av tidskriften Notices of the American Mathematical Society.³

Fotnoter

1) Berättelsen är fiktiv. Varje eventuell överensstämmelse med verkliga förhållanden är en tillfällighet.

2) Låt oss se det hela ur Bloms synvinkel. Om han har oturen att träffa på Adamsson kostar det honom 50 minuter av hans liv om det sker på Finkrogen, medan det på Kåren bara kostar 20. Bättre för Blom att välja Kåren alltså? Problemet är bara att om Adamsson genomskådar detta, så väljer han också Kåren. Alltså kanske det är läge för Blom att försöka finta Adamsson genom att välja Finkrogen. Den illistigheten kan dock bli kostsam om den genomskådas av Adamsson, vilket kanske talar för att Blom trots allt borde välja Kåren. Men då finns risken att... ja, läsaren inser här att detta resonemang kan itereras hur många gånger som helst utan att vi kommer fram till något bestämt.

Vad som emellertid är uppenbart är att det är viktigt för Blom att hans val blir oförutsägbart. Låt oss därför prova ett nytt koncept: att låta slumpen styra. Blom singlar en slant, så att han går till Kåren med sannolikhet 1/2, och till Finkrogen med sannolikhet 1/2. Mot den strategin finns inget sätt för Adamsson att säkerställa ett lunchmöte med Blom. Det bästa han kan göra är att välja Finkrogen varje gång, vilket ger 50 eller 0 minuter med Adamsson med sannolikhet 1/2 vardera, dvs ett väntevärde (förväntat genomsnitt) om (50+0)/2=25 minuter. Ur Bloms synvinkel verkar detta klart sämre än att konsekvent välja Kåren, vilket inte riskerar kosta mer än 20 minuter.

Innan vi ger upp om Bloms randomiseringsmetod bör vi dock fråga oss om den inte möjligen kan förfinas. Det faktum att Adamssons bästa svar är att välja Finkrogen tyder på att Blom valt denna med lite för hög sannolikhet. Låt oss säga att Blom istället väljer Finkrogen med någon annan sannolikhet p, och således Kåren med resterande sannolikhet 1-p. Om Adamsson då väljer Finkrogen blir Bloms förväntade dödtid med Adamsson 50p. Om Adamsson istället väljer Kåren blir förväntade tiden 20(1-p). Om 50p är större än 20(1-p) så är det bättre för Adamsson att välja Finkrogen än att välja Kåren, varför Blom kanske därför borde ha valt ett mindre p. Om olikheten går åt andra hållet borde han av motsvarande skäl ha valt ett större p. Alltså borde likhet gälla, och vi får ekvationen 50p=20(1-p), vilken har lösningen p=2/7. Blom bör alltså välja Kåren med sannolikhet 5/7 och Finkrogen med sannolikhet 2/7, och försäkrar sig på så vis (vilket är lätt att kontrollräkna) om ett väntevärde på 100/7 = lite drygt 14 minuter med Adamsson, oavsett hur Adamsson agerar. Detta är en klar förbättring över såväl den renodlade Kåren-strategin som 50-50-stragein p=1/2.

Motsvarande analys ur Adamssons synvinkel ger, lustigt nog, resultatet att även han bör välja Kåren med sannolikhet 5/7 och Finkrogen med sannolikhet 2/7. Om både Adamsson och Blom begagnar sig av denna strategi har ingen av dem något att vinna på att avvika från den, och de befinner sig i vad som brukar kallas en Nashjämvikt, efter John Nash som för sina banbrytande insatser i spelteori belönades med Sveriges Riksbanks pris i ekonomisk vetenskap till Alfred Nobels minne 1994.

3) Läsaren kan notera att min recension till 97% eller så är ytterst välartad och att jag stryker tidskriftens läsekrets av företrädesvis amerikanska matematiker medhårs, men att jag mot slutet av min text, i näst sista styckets sista mening "A major example is the emission..." med tillförande Fotnot 2, bestämmer mig för att no more Mr Nice Guy! Där tar jag bladet från munnen och uttrycker min djupt kända uppfattning rörande USA:s agerande i den gigantiska allmänningens tragedi som de pågående antropogena klimatförändringarna utgör.

3 kommentarer:

Patrik Lindenfors15 december 2011 kl. 09:20
För att göra det enklare för oss båda kommer jag att avtala tid med dig nästa gång vi ska luncha. Så får jag se om du dyker upp.
SvaraRadera
Svar
Olle Häggström15 december 2011 kl. 09:51
Hmm... försöker du finta mig nu, Patrik?
SvaraRadera
Svar
Lennart W11 januari 2012 kl. 13:13
Den här kommentaren har tagits bort av skribenten.
SvaraRadera
Svar

Lägg till kommentar