fredag 18 januari 2013

Silverprediktioner

Det tycks mig en smula ironiskt att USA:s idag troligtvis mest välkände statistiker inte är utbildad statistiker. Jag vill dock inte racka ned alltför mycket på Nate Silver för denna brist i hans CV, då han är mycket begåvad och genom praktisk erfarenhet skaffat sig omfattande kunskaper i ämnet. Han har en examen i nationalekonomi från 2000, hade ett enligt egen utsago tråkigt jobb i en ekonomisk konsultfirma fram till 2003, och utveckalde samtidigt på sin fritid programmet PECOTA (Player Empirical Comparison and Optimization Test Algorithm) för prediktering av professionella basebollspelares framtida prestationer, vilket blev så framgångsrikt att han till slut hade råd att säga upp sig och satsa helhjärtat på sina egna projekt (inklusive en kort period som professionell pokerspelare). Sin stora berömmelse vann han som prediktionsguru inte inom baseboll utan inom amerikansk politik. I mars 2008 lanserade han sin blogg FiveThirtyEight1, och kom snabbt att väcka stor uppmärksamhet för sina träffsäkra prognoser. I presidentvalet mellan Obama och McCain i november 2008 prickade han rätt vinnare i 49 av 50 delstater, och fyra år senare mellan Obama och Romney klarade han alla 50.

Nate Silvers bok The Signal and the Noise: The Art and Science of Prediction utkom i september förra året och tog sig snabbt in på bästsäljarlistorna. Den 500-sidiga boken är skriven med ett utpräglat journalistiskt driv, och är både lättläst och bitvis så intressant att den är svår att lägga ifrån sig. Flertalet kapitel behandlar prediktion inom något specifikt område, från meteorologi och jordbävningar till poker och finansmarknader, och så naturligtvis Silvers egna specialområden baseboll och amerikansk politik.

Silver är mycket skicklig på att utveckla framgångsrika prediktionsmodeller och -algoritmer, och det finns väldigt mycket att hålla med om när det gäller allmänna råd och recept för framgångsrik prediktion. Exempelvis är det bara att instämma då han framhåller vikten av mekanistisk förståelse (att sätta sig in i de kausala samband som ligger bakom det fenomen man modellerar, i motsats till det slags kurvanpassning där man inte bryr sig mycket om vad kurvorna egentligen står för). Detsamma gäller hans ställningstagande mellan hedgehogs och foxes i Isaiah Berlins instruktiva tankefigur där en igelkott (hedgehog) har en enda stor idé att arbeta med, medan en räv har många små; mycket av Silvers framgång som prognosmakare består i att han förmår kombinera informationen i många olika (slags) kunskapskällor snarare än att ensidigt fokusera på en eller några få. Den tankefigur som bokens titel fömedlar - vikten av att kunna skilja ut den relevanta signalen i vad som ofta är ett hav av brus - är också mycket användbar och viktig. Och ännu en viktig lärdom är att man inte bör nöja sig med att ange vilket utfall man finner allra sannolikast - i de flesta beslutssituationer finns all anledning att försöka precisera en fördelning som ger sannolikheter för alla möjliga utfall.

Mycket klok är också Silvers betoning av hur viktigt det är att försöka göra en så träffsäker prediktion som möjligt. Detta kan i förstone synas så självklart att det inte ens behöver nämnas, men han ger genom boken en rad exempel på hur prognoser förvrids då prognosmakare har andra incitament än att prognosticera så träffsäkert som möjligt. Till exempel framstår det initialt som en smula gåtfullt hur amerikanska TV-stationer tenderar att göra betydligt sämre väderprognoser än den federala väderbyrån NWS (National Weather Service), trots att de har gratis tillgång till prognoserna från NWS och därmed kan försäkra sig om att göra lika bra prognoser genom att helt enkelt apa efter. Det visar sig emellertid att TV-stationernas önskan att hålla sig väl med sina tittare skapar en bias i deras väderprognoser. Tittare tenderar att bli argare då prognoserna förutsagt sol medan verkligheten levererat regn än vice versa, något som får TV-stationerna att i överlag överdriva risken för regn. Silver ger också exempel på hur liknande asymmetrier bland fondförvaltare på Wall Street kan bidra till flockmentalitet och kollektiv oförmåga att rätt bedöma risken för börsnedgångar och krascher.2

Jag har som synes mycket gott att säga om Nate Silvers bok. Den bjuder på många klokskaper, och jag bedömer att den kan njutas med stor behållning av ett brett spektrum av läsare på alla nivåer från gymnasister till professorer. Likväl är det något med den som inte känns bra. Silver talar genomgående med stor auktoritet, men kan vi verkligen lita på att han har täckning för det?

Mina egna förkunskaper om de ämnen bokens olika kapitel tar upp varierar kraftigt, från näst intill total okunnighet (som Kapitel 3 om baseboll, Kapitel 5 om jordbävningar och Kapitel 10 om poker) via ett lite bättre hum (som Kapitel 4 om meteorologi och Kapitel 7 om epidemier och infektionssjukdomar) och riktigt hygglig pålästhet (Kapitel 12 om klimatvetenskap) till vad jag dristar mig kalla expertis (Kapitel 8 om statistiska slutledningsprinciper och Kapitel 9 om schack). Överlag kan om min upplevelse av boken sägas att den var som mest njutbar i de kapitel som behandlar ämnen jag visste mycket lite om, medan ju mer jag behärskade ämnet desto oftare stötte jag på tveksamheter och rena felaktigheter i texten, och vad gäller de tre sistnämnda kapitlen tycker jag att de inte håller måttet för vad man kan begära av god populärvetenskap i fråga om vederhäftighet. Man kan nu fråga sig om det är en tillfällighet att just de tre kapitel vilkas innehåll jag kan något om är så dåliga, eller om det möjligen kan vara så att övriga kapitel är lika dåliga men att jag helt enkelt saknar de specialkunskaper som krävs för att genomskåda detta. Jag lämnar detta som en öppen fråga, men vill avsluta med att ge exempel på störande dumheter i Kapitel 8, 9 och 12.

Kapitel 8 om statistisk slutledning. Vad gäller metodologi är detta bokens centrala kapitel. Nate Silver förordar bayesiansk uppdatering av a priori-sannolikheter i ljuset av data. Utan tvivel är detta en stor del av "hemligheten" bakom hans framgångar som prognosmakare, och på områden som poker och oddssättning på vadslagningsbyråer kan man lugnt säga att hans förhållningssätt är det enda rimliga. Men när han mer allmänt tar ställning i frågan om bayesianska kontra frekventistiska metoder3 - en av de mest debatterade principfrågorna inom den matematiska statistiken under större delen av 1900-talet och framåt - gör han det onyanserat och ovederhäftigt. Hans beskrivningar av frekventistisk statistik är aggressivt tendentiösa och ofta direkt felaktiga, som att "sampling error [is] the only type of error that frequentist statistics directly accounts for" (sid 252) eller att "frequentist methods - in striving for immaculate statistical procedures that can't be contaminated by the researcher's bias - keep him hermetically sealed off from the real world" (sid 253). Precis som ekonomerna Thomas Ziliak och Deidre McCloskey i deras uppmärksammade bok The Cult of Statistical Significance (som jag skrivit om här) övergår Silver i sina attacker på frekventismen till att även attackera personen Sir Ronald Fisher (1890-1962), allmänt känd som den frekventistiska statistikens fader. Fisher var en inbiten rökare, och vägrade hårdnackat (och pinsamt nog för en vetenskaplig frontfigur som han) att acceptera slutsatsen att rökning orsakar lungcancer. Korrelationen kunde han inte förneka, men föreslog alternativa kausalsamband, som att någon viss defekt i lungan skulle dels på sikt ge upphov till lungcancer, dels ge en retning som triggar folk att som lindring börja röka. Med facit i hand kan vi skratta åt detta, men Silver är helt fel ute när han hävdar att det var Fishers frekventistiska tankesätt som tillät honom hans ståndpunkt. Silver tycks mena att om Fisher varit bayesian, så hade han haft förstånd att representera långöktheten i han alternativa kausalteori med en mycket låg a priori-sannolikhet, och därmed ge hög sannolikhet åt det gängse kausalsambandet mellan rökning och lungcancer. Silvers argumentation här är helt orimlig, för det första för att Fisher, färgad av önsketänkande, givetvis inte hade valt en sådan a priori-fördelning, och för det andra (och viktigare!) för att vetenskapliga frågor inte skall avgöras genom val av a priori-fördelning utan genom fortsatt anskaffning av allt bättre evidens av olika slag.

Opinionsläget i fråga om bayesianism kontra frekventism bland akademiska matematiska statistiker är idag betydligt mindre upphettat för några år sedan, och de flesta i den yngre generationen av forskare inser att bayesianska metoder passar bra för vissa problem, frekventistiska passar bättre för andra, medan åter andra lämpligen kan behandlas med hybrider och kombinationer av de båda verktygslådorna. När Silver ger sin sammanfattning av läget med (sid 260)...
    Recently [...] some well-respected statisticians have begun to argue that frequentist statistics should no longer be taught to undergraduates. And some professions have considered banning Fisher's hypothesis test from their journals. In fact, if you've read what's been written in the past ten years, it's hard to find anything that doesn't advocate a Bayesian approach.
...så är påståendena i de två första meningarna i sak riktiga men tendentiöst utvalda, medan den tredje meningen är ett rent påhitt och ger en helt missvisande bild av hur det ligger till.

Kapitel 9 om schack. I detta kapitel, som mestadels uppehåller sig vid kampen mellan människa och schackdator, är det tydligt hur Silver låtsas behärska schacklig jargong och avancerade koncept men sätter ihop de fina nyckelorden på ett sätt som avslöjar hur lite han förstår om schack. Jag vill inte uppehålla mig vid detta4, mer än att konstatera det lite lustiga faktum att Silver gör sig skyldig till den (troligtvis) mest felaktiga sifferuppskattning jag någonsin sett. I sin förklaring till varför schackdatorer inte kan jobba sig igenom alla tänkbara varianter när de väljer ett drag framhåller Silver det (mer än) astronomiska antalet möjliga partier att tugga sig igenom, och den praktiska orimligheten i att göra det. Detta är helt riktigt, men den konkreta siffra han anger - 101050 - för det ungefärliga antalet möjliga schackpartier är fullkomligt hårresande uppåt väggarna, och det förvånar mig att Silver, som ändå besitter den allmänmatematiska kompetens som krävs för att snabbt konstatera detta, okritiskt släpper ifrån sig en sådan uppgift.5,6

Kapitel 12 om klimatvetenskap. Detta kapitel bedömer jag vara avsevärt bättre än Kapitel 8 och 9, och Silver gör många kloka påpekanden, inte minst då han betonar att vår gedigna förståelse för växthuseffekten och andra fysikaliska mekanismer inblandade i klimatsystemet gör våra kunskaper om klimatförändringarna och deras orsaker mycket solida. Sedan ägnar han emellertid alldeles för mycket kraft åt att analysera hur väl scenarier och förutsägelser gjorda för några få år sedan7 och avsedda för återstoden av århudradet har fallit ut de senaste åren - i stort sett meningslösa räkneövningar då så korta tidsskalor gör att trenderna rätt och slätt drunknar i klimatsystemets brus. Silver är på tok för otydlig på denna punkt.

Fotnoter

1) Bloggen namn kommer av att 538 är antalet delegater i det amerikanska elektorskollegiet.

2) Silvers förklaring är så instruktiv att den förtjänar att citeras. Tänk dig att du är en aktiehandlare vars framtida lönekuvert och bonusar naturligtvis är beroende av hurpass väl du lyckas med att tjäna pengar åt din arbetsgivare. Det är viktigt att du rätt kan förutse huruvida marknaden är på väg upp (Köp! Köp! Köp!) eller ner (Sälj! Sälj! Sälj!), men du bör också beakta vilka de eventuella konsekvenserna blir om du gissar fel. Här föreligger (sid 355, originalets fetning) en viss asymmetri:
  • The trader buys but the market crashes. This is no fun: he's lost his firm a lot of money and there will be no big bonus and no new Lexus. But since he's stayed with the herd, most of his colleagues will have made the same mistake. Following the last three big crashes on Wall Street, employment at securities firms decreased by about 20 percent. That means there is an 80 percent chance the trader keeps his job and comes out okay; the Lexus can wait until the next bull market.
  • The trader sells but the market rises. This scenario, however, is a disaster. Not only will the trader have significantly underperformed his peers - he'll have done so after having stuck out his neck and screaming that they were fools. It is extremely likely that he will be fired. And he will not be well-liked, so his prospects for future employment will be dim. His career earnings potential will have been dramatically reduced.
Med sådana incitament, påpekar Silver, behöver man känna sig väldigt säker på att en nedgång är nära förestående innan man vågar satsa på att så är fallet.

3) Någon text som helt ägnas denna debatt har jag inte författat, men här, här och här delar jag med mig av min balanserade syn på frågan.

4) Här, emellertid, är ett typiskt exempel: I första matchpartiet 1997 mellan dåvarande världsmästaren Garri Kasparov och datorprogrammet Deep Blue överraskade den förstnämnde med att efter inledningsdragen 1. Sf3 d5 2. g3 Lg4 (onödigt svåra att rekonstruera ur Silvers bok på grund av ett fel i diagrammet på sid 271) avvika från gängse spelöppningsteori med det ovanliga 3. b3. Om detta skriver Silver (sid 270) att Deep Blues spelöppningsdatabas "relied on the assumption [...] that Kasparov would respond as almost all players had when faced with this position, by moving the knight back out of the way", följt av en fotnot om löparparets värde som ger (det helt orimliga) intrycket av att detta (löparparets värde) är något som Kasparov men inte Deep Blue kände till. Mycket rimligare hade varit att säga något om den försvagning av vits bondestruktur som ett byte på f3 skulle åstadkomma, och hur denna kan vägas mot fördelen av att inneha löparparet. För övrigt skulle ingen enda någorlunda kunnig schackspelare i ställningen efter svarts andra drag mer än för högst ett ögonblick överväga "moving the knight back out of the way" (till g1 alltså). Vad däremot många gjort i ställningen är att kasta springaren framåt (3. Se5), men klart vanligast är faktiskt 3. Lg2, vilket tillåter bytet på f3 men undviker den vidhängande bondeförsvagningen (varefter svart som regel avstår från att slå springaren).

5) Om a är en övre gräns för maximala antalet tillgängliga drag i en ställning, och b är en övre gräns för antalet drag i ett schackparti, så är a2b en övre gräns för antalet möjliga schackpartier. Med hjälp av 50-dragsregeln går det lätt att härleda att b är högst 5950, och en grov övre gräns för a är 169 321. Antalet möjliga schackpartier är därför högst lika med 169 32111900 vilket är mindre än 1026512 29828 - förvisso ett ofattbart stort tal, men ändå rent ut sagt löjligt litet jämfört med 101050.

6) Det är oklart var Silver fått sin siffra ifrån. Han hänvisar till Kasparovs intressanta essä The Chess Master and the Computer i New York Review of Books för ett par år sedan, men i denna text anger Kasparov antalet till 10120. Ironiskt nog är även denna siffra alldeles på tok, och faktiskt (dess enorma astronomiska storlek till trots) för liten. Det är inte svårt att rigoröst konstruera en uppsättning schackpartier som till antalet överstiger 10500 eller mer.

7) Exempelvis diskuterar Silver i detalj (sid 381 och framåt) den vadslagning rörande global temperaturutveckling som en klimatförnekare vid namn Scott Armstrong 2007 föreslog Al Gore. Att jämföra hur många månader som sedan dess kommit närmare den temperaturutveckling Armstrong föreslog åt sig själv än den han tillskrev Gore, ger data med ett så dåligt signal/brus-förhållande att de i princip är värdelösa.

Edit 19 januari 2013: Jag vill inte längre stå för Fotnot 5:s skattning a=169, utan korrigerar för att vara på den säkra sidan till a=321. När jag härledde a=169 tyckte jag att jag var fiffig som tog i beaktande att bönder som står på sjunde raden kan ha upp till 12 olika drag att välja mellan, tack vare att det finns fyra olika pjäser att promovera till. Desto märkligare att jag glömde att beakta den ökade rörelsefrihet som promoverade bönder kan ha. Min nya försiktigare skattning a=321 bygger på värsta fall-scenariot att den som är vid draget har nio damer (och således noll bönder). Med lite skicklighet bör det gå att pressa ned skattningen rejält. J.E. Littlewoods motsvarande skattning (i det manus som diskuteras i kommentarstråden nedan) är 332. Diskrepensen mot mitt nya 321 ser ut att bero på att Littlewood skattat maximala antalet rutor en löpare kan nå med 14 istället för optimala 13, och motsvarande ickeoptimalitet för damer.

24 kommentarer:

  1. Tack för ännu en underhållande och lärorik text, Olle!

    SvaraRadera
  2. Synnerligen intressant och läsvärt, Olle. Inte minst för oss som både är forskare och schackspelare! Ska lägga en "puff" på min blogg.

    SvaraRadera
  3. Läst http://www.huffingtonpost.com/mobileweb/michael-e-mann/nate-silver-climate-change_b_1909482.html
    ?

    SvaraRadera
  4. Lars och Thomas: Tack för uppmuntrande tillrop!

    Magnus: Tack för länk! Manns uppfattning om Silvers kapitel 12 stämmer rättså bra med min, även om jag inte reagerade fullt lika hårt som han.

    SvaraRadera
  5. Troligen blev Mann lite putt när han gått igenom saker med Silver och det ändå blir fel i boken...

    SvaraRadera
    Svar
    1. Ja, uppenbarligen. Och helt förståeligt!

      Radera
  6. Har just kommit tillbaka till jorden efter de vänliga orden i toppliste-inlägget...

    Den märkliga partiuppskattningen kändes inte helt obekant, och en snabb titt i »Schach und Zahl» bekräftar detta. Enligt Karl Fabel, som skrivit avsnittet ifråga, har J.E. Littlewood räknat »väsentligt exaktare» och kommit fram till siffran 10**10**70,5. Littlewood förklarar sin uträkning i »A Mathematician's miscellany», sid 108-109, men jag kan inte direkt påstå att jag förstår hur han gör; jag är inte ens säker på att han verkligen kommer fram till den siffra Fabel anger eftersom trycket och Littlewoods notation, med decimalpunkter placerade på nya och spännande platser, är märklig för en icke-matematiker som övertecknad. Så mycket har jag i alla fall insett att någon 50-dragsregel använder han inte; snarare tycks han beräkna något slags »arrangemang» (en generaliserad position), men hur han gör och hur de ska kunna begränsa antalet partier förstår jag inte. Jag hoppas någon matematiker kan reda ut vad Littlewood pysslar med; tills vidare misstänker jag att detta inte var den beräkning Littlewood var allra stoltast över... (Boken finns i elektroniskt format på archive.org)

    SvaraRadera
    Svar
    1. Tack för länken till Littlewood! Det är helt klart att han inte använder 50-dragsregeln i sin uppskattning; däremot använder han sig av dragupprepningsregeln (som ju egentligen borde heta ställningsupprepningsregeln) i uppskattningen på s 109, rad 4. I vänsterledens exponent 2a+1 är a av allt att döma (hans övre skattning för) antalet möjliga ställningar, tvåan står för att varje ställning får lov att uppkomma två gånger, och ettan är med för att tillåta att en enda ställning uppkommer ytterligare en gång innan dragupprepningsregeln gör slut på partiet.

      Littlewood är uppenbarligen helt klar över att det inte handlar om en realistisk uppskattning av antalet partier utan blott om en mycket grov övre begränsning. I Silvers framställning finns inget spår av någon sådan distinktion.

      Radera
    2. Okej; då är jag med på den delen. Men jag förstår fortfarande inte vad han menar med a; om det är antalet möjliga ställningar som han påstår så borde ju 64**13 vara en övre gräns (antalet rutor upphöjt till de det antal olika symboler som kan associeras till en ruta), och det är betydligt mindre än 10**69.7, om jag nu inte räknar fel i huvudet. Han skriver något om en "individuality convention"; betyder det att han på något sätt anser att varje pjäs är unik? I så fall tror jag att han tar sig ganska stora friheter med ställningsupprepningsregeln...

      Radera
    3. Instämmer. Din enkla övre gräns är väldigt mycket bättre än Littlewoods.

      Radera
    4. Nej nej nej för bövelen, vänta lite nu, stopp och belägg, stryk min förra kommentar! Bosjo, när du anger din övre gräns som 64**13 så tror jag att du vid närmare eftertanke håller med mig om att du kastat om storheterna och egentligen menar 13**64. Och då hamnar du i höjd med Littlewood.

      Radera
    5. Aaaargh...! Visst har du rätt. Jag skyller på att jag bröt mot den gyllene regel som säger att man inte ska försöka tänka på morgonen. Dessutom borde det nog vara 2*13**64, eftersom en ställning med vit vid draget inte räknas som identisk med samma ställning med svart vid drag.

      Radera
    6. Om du händelsevis känner till någon tid på dygnet då man garanterat inte gör den sortens små lapsusar så är jag extremt intresserad av att få besked om det!

      Radera
    7. När du nämner "individuality convention" för scahckpjäser, bosjo, så kommer jag att tänka på mitt parti som vit mot Lars Blomström i SM 2000. Öppningsdragen 1. d4 Sf6 2. c4 g6 3. Sc3 Lg7 4. e4 d6 5. h3 0-0 6. Lg5 Sa6 7. Ld3 e5 8. d5 c6 9. Sge2 cxd5 10. cxd5 Sc5 11. Lc2 a5 12. a3 Ld7 13. Tb1 a4 14. 0-0 Da5 är det måhända inget större fel på, men i vad som sedan följer tappar jag tråden alldeles: 15. Sc1 Tfc8 16. S1a2 Sh5 17. Se2 Lb5 18. Sac3. Vad har jag åstadkommit med mina fyra senaste drag? Jo, medan svart flyttat fram sina positioner har jag lyckats byta plats på c3- och e2-springaren! (Efter ett svängigt fortsatt parti fick jag ge slaget förlorat strax efter 40-dragskontrollen.)

      Radera
    8. Et tu Brute... Jag har lyckats med något liknande; jag skrev till och med en snutt om det (tillsammans med en annan, likartad, manöver) i ett LASSmeddelande på 80-talet. Ska se om jag kan hitta artikeln och lägga upp den på bloggen så småningom, även om bosjo, modell -13, förmodligen kommer att behöva frisera vad bosjo, modell 80-tal, skrev...

      Radera
    9. Under partiet mot Blomström var jag hur som helst lyckligt omedveten om att min snillrika springarmanöver hade en föregångare i Sjögren-Eriksson, Linköping(?) 1979.

      Radera
  7. Olle: Jag blev intresserad av din referens till McCloskey/Zilliacs bok. Jag hade tillfälle att träffa Deirdre i fjol i samband med att vi satt med i en betygsnämnd på en avhandling i Göteborg och pratade en bra stund med henne om bl a boken i fråga. Jag har skrivit en artikel om debatten kring statistical significance testing som kanske kan vara av intresse:
    http://larspsyll.wordpress.com/2013/01/19/sizeless-science-and-the-cult-of-statistical-significance/

    SvaraRadera
    Svar
    1. Tack för länk, Lars! Det verkar som om du förordar att vi ersätter signifikanstest med konfidensintervall. Frågan har diskuterats tidigare här på bloggen - se diskussionen till min bloggpost De empiriska vetenskapernas desperata behov av statistisk kompetens . Att ersätta signifikanstest med konfidensintervall är förvisso en god idé i många fall, men ibland är det helt enkelt inte genomförbart, och jag ser ingen möjlighet att rätt och slätt avskaffa signifikanstestet.

      Radera
    2. Ja, konfidensintervall är i regel mer informationstäta än p-values, men fr a tycker jag det vore bra om vi kunde komma bort från den ensidiga inriktningen på att vid resultatrapportering skjuta in oss p-value (med risk för en alltför hög fokusering på en ur hypotestestningssynpunkt arbiträrt vald H0) och standardmässigt rapportera effect size mått och power. Problemet vi har haft i den ekonomiska vetenskapen handlar delvis också om att i princip alla variabelrelationer kan göras statistiskt signifikanta med tillräckligt stort antal observationer. I tillämpade vetenskaper är det inte den statistiska signifikansen som är av överordnat intresse, utan den substantiella signifikansen, något som p-value fixeringen gör att inte minst studenter och icke-specialister har en tendens att glömma bort.

      Radera
  8. Du som har (?) tillgång kanske kan ge en rapport om denna http://www.sciencemag.org/content/339/6121/758.short

    ?

    SvaraRadera
    Svar
    1. Tack Magnus för länk! Wang och Campbell uppvisar, i deras recension av Silver, slående samstämmighet med vad jag skriver i min bloggpost. Exempelvis:

      "At times Silver writes as if the cure for bad modeling can be reduced to 'more Bayes'. Such a prescription does not do justice to the historic controversies surrounding interpretations of probability. A beginner might come away from this book believing that an earlier generation of frequentists were simply ignorant. In a cartoonish account, Silver lobs a broadside at a monumental figure in statistics, Ronald A. Fisher, who late in life argued against the idea that smoking causes cancer—and who coined 'Bayesian' as a derogatory term. Silver suggests that Fisher's aversion to Bayes caused him to err. In fact, the real problem was that Fisher was a smoker. Fisher's prior beliefs prevented him from accepting epidemiological and biological evidence, an erroneous prior if ever there was one."

      Radera