söndag 30 mars 2014

Darwin, Einstein, Dyson

Jag hyser stor beundran för den 90-årige Freeman Dyson. Han kan, även om han inte belönats med något Nobelpris, räknas som en av de riktigt stora bland nu levande fysiker, i kraft av viktiga insatser inom bland annat kvantfältteori och fasta tillståndets fysik. Han har också varit föredömligt produktiv när det gäller att skriva för en bredare allmänhet, och jag uppskattar hans böcker Disturbing the Universe (1979) och The Scientist as Rebel (2006) som båda är mycket rika på originellt och intressant innehåll.1

Dessa insatser gör det lätt att förlåta vissa drag i hans personlighet som drar åt det lite löjliga hållet. Det är uppenbart att han anser sig vara bättre än snart sagt alla andra på att tänka kreativt och utanför boxen, och att han gärna ser sig själv som (vilket ju antyds redan i titeln på boken från 2006) en upprorsmakare med den viktiga uppgiften att kullkasta gamla stelnade vetenskapliga dogmer. Detta är en inställning som säkert bidragit till att han i sin forskning vågat ta viktiga nydanande steg, men som ibland också yttrar sig som dåligt omdöme (vilket vi ser t.ex. i hans böjelse för klimatförnekeri) och i ett lite väl omaskerat självförhärligande. Min avsikt idag är att ge ett aktuellt exempel där hans självförhärligande slår över i det rent grandiosa.

I en text rubricerad The Case for Blunders, nyligen publicerad i husorganet New York Review of Books, recenserar Dyson i positiva ordalag den aktuella boken Brilliant Blunders av Mario Livio, som, med utgångspunkt från kända exempel där Charles Darwin, Lord Kelvin, Linus Pauling, Fred Hoyle och Albert Einstein drivit vetenskapliga ståndpunkter som senare visat sig felaktiga, förklarar hur utomordentligt produktivt och vetenskapligt hälsosamt det är at våga ha fel. Mot slutet av sin text berättar Dyson om sin egen största tabbe som vetenskapsman:
    I observed [in 1967] that our proof of the stability of matter would fail if electrons without the exclusion principle existed. So I jumped to the conclusion that a charged weak boson could not exist in a stable universe. This was a new law of nature that I had discovered. I published it quietly in a mathematical journal.

    I knew that my theory flatly contradicted the prevailing wisdom. The prevailing wisdom was the unified theory of weak and electromagnetic interactions proposed by my friends Steven Weinberg and Abdus Salam. Weinberg and Salam predicted the existence of a new particle as a carrier of weak interactions. They called the new particle W. The W-particle had to be a charged weak boson, precisely the combination that I had declared impossible. Nature, speaking through an experiment at CERN in Geneva, would decide who was right.

    The decision did not come quickly. It took the experimenters fifteen years to build a new machine and use it to search for the W-particle. But the decision, when it came, was final. Large numbers of W-particles were seen, with the properties predicted by Weinberg and Salam. With hindsight I could see several reasons why my stability argument would not apply to W-particles. W-particles are too massive and too short-lived to be a constituent of anything that resembles ordinary matter.

Så långt låter ju detta ödmjukt och bra, men hör här vilka namn som Dyson genast buntar ihop sitt eget med, under samlingsnamnet "the greatest scientists":
    I quickly forgot my disappointment and shared the joy of Weinberg and Salam in their well-deserved triumph. As my mother taught me long ago, the key to enjoyment of any sport is to be a good loser.

    In Livio’s list of brilliant blunderers, Darwin and Einstein were good losers, Kelvin and Pauling were not so good, and Hoyle was the worst. The greatest scientists are the best losers. That is one of the reasons why we love the game.

Darwin, Einstein, Dyson.

Fotnot

1) Jag utvecklar min syn på Freeman Dyson mer utförligt och nyanserat i den gamla UI-bloggposten Den oundgängliga trovärdighetsbedömningen: fallet Dyson.

torsdag 27 mars 2014

Orwell om det engelska språket

Då jag häromdagen tittade in på den trevliga bokhandeln Aniara på Linnégatan i Göteborg fick jag raskt ögonen på ett litet häfte med titeln Politics and the English Language. Författaren är George Orwell - en av 1900-talets riktigt stora - och det tog mig inte många sekunder att besluta mig för att punga ut med de 19 kr som prislappen angav.1

Huvuddelen av häftet utgörs av den essä med samma namn som först utom 1946.2 Här går Orwell till generalangrepp mot den förslappning av det engelska språket, främst inom politisk retorik, som han menar går hand i hand med en motsvarande förslappning i själva tänkandet. Essän är mycket vass och fruktansvärt rolig, och vad som slår mig allra mest är hur aktuell den ännu känns, nära 70 år senare.3 Hans krav på gott språk är högt ställda, och inför passager som...
    Modern writing at its worst does not consist in picking out words for the sake of their mening and inventing images in order to make the meaning clearer. It consists in gumming together long strips of words which have already been set in order by someone else, and making the results presentable by sheer humbug. The attraction of this way of writing is that it is easy. It is easier - even quicker, once you have the habit - to say In my opinion it is a not unjustifiable assumption that than to say I think.4
...känner jag tydligt vilket rungande underkänt min egen språkbehandling (såväl på engelska som på svenska) skulle få med Orwell som censor.

Han förutskickar också det Newspeak5 som senare skulle bli så känt genom hans roman Nineteen Eighty-Four:
    Defenseless villages are bombarded from the air, the inhabitants driven out into the countryside, the cattle machine-gunned, the huts set on fire with incendiary bullets: this is called pacification. Millions of peasants are robbed of their farms and sent trudging along the roads with no more than they can carry: this is called transfer of population or rectification of frontiers. People are imprisoned for years without trial, or shot in the back of the neck or sent to die of scurvy in Arctic lumber camps: this is called elimination of unreliable elements. Such phraseology is needed if one wants to name things without calling up mental pictures of them. Consider for instance some comfortable English professor defending Russian totalitarianism. He cannot say outright, 'I believe in killing off your opponents when you can get good results by doing so.' Probably, therefore, he will say something like this:
      While freely conceding that the Soviet régime exhibits certain features which the humanitarian may be inclined to deplore, we must, I think, agree that a certain curtailment of the right to political opposition is an unavoidable concomitant of transitional periods, and that the rigors which the Russian people have been called upon to undergo have been amply justified in the sphere of concrete achievement.
Mot slutet av essän sammanfattar Orwell sina rekommendationer i sex punkter:
    i. Never use a metaphor, simile or other figure of speech which you are used to seeing in print.

    ii. Never use a long word where a short one will do.

    iii. If it is possible to cut a word out, always cut it out.

    iv. Never use the passive where you can use the active.

    v. Never use a foreign phrase, a scientific word or a jargon word if you can think of an everyday English equivalent.

Så långt kommen känner jag att Orwells regler är snudd på omöjliga att fullt ut leva upp till, men så kommer hans sjätte punkt, vars gummiparagrafskaraktär lättar upp instruktionerna en smula:
    vi. Break any of these rules sooner than say anything outright barbarous.

Fotnoter

1) George Orwell (1903-1950) är mest känd för sina dystopiska romaner Animal Farm och Nineteen Eighty-Four, och för den principfasta hållning mot sovjetisk och annan diktatur som där kommer till uttryck. Personligen förknippar jag Animal Farm med ett av de lustigaste sammanträffanden jag varit med om. Handlingen börjar med hur djuren på en bondgård benämnd Manor Farm gör revolution mot bonden och tar över makten. En av de första åtgärderna för att markera maktövertagandet blir att döpa om gården till Animal Farm. Gårdens grisar blir snabbt till en korrupt maktelit, alltmer lik det tidigare mänskliga styret. En symbolladad passage är då de bestämmer sig för att återta det gamla namnet på gården. Jag läste boken i juni 1991, och jag minns hur jag, liggandes på sängen i det studentrum jag då bodde i, just hade läst den passagen, lade ifrån mig boken och slog på radion för att höra de senaste nyheterna från Dagens Eko. Dessa förkunnade beslutet att officiellt döpa om den stad som då hette Leningrad till dess äldre namn Sankt Petersburg. (Parallellen mellan dikt och verklighet är här inte perfekt, men sammanträffandet var likväl förbluffande.)

2) Häftet innehåller också Orwells i mars 1940 publicerade recension av Adolf Hitlers Mein Kampf. Recensionen är (givetvis) mycket välskriven, och jag slås av vilken insiktsfullhet om Hitler och vad denne stod för som det redan då var möjligt (för en välinformerad person som Orwell) att besitta.

3) Till och med de språkliga föroreningar som han menar utgör övergående fenomen dröjer sig kvar ännu idag, 2014. Orwell gör helt klart en missbedömning då han, i ett försök att påvisa att det faktiskt är möjligt att göra något åt det språkliga förfallet, skriver följande.
    Silly words and expressions have often disappeared, not through any evolutionary process but owing to the conscious action of a minority. Two recent examples were explore every avenue and leave no stone unturned, which were killed by the jeers of a few journalists.

4) Orwell går loss specifikt mot konstruktionen not un- (som i not unjustified och not uncommon), och föreslår som ett vaccin memorerandet av meningen A not unblack dog was chasing a not unsmall rabbit across a not ungreen field. (Jag undrar vad han skulle ha sagt om det förtjusande svenska uttrycket inte oäven.)

5) Det är detta nyspråk som numera oftast avses med ordet orwellsk som t.ex. då jag häromsistens dömde ut det nya namnet på Sveriges mest kända klimatförnekarblogg The Climate Scam som "orwellskt klingande".

lördag 22 mars 2014

Bans on research - an unseemly topic to discuss at a science academy?

It may seem immodest of me to say so as an organizer of the event, but I do think that the symposium Emerging Technologies and the Future of Humanity, held at the Royal Swedish Academy of Sciences (KVA) in Stockholm last Monday, was a success. The meeting saw illuminating and insightful discussion of possible prospects and consequences of a number of radical emerging and future technologies, thereby achieving the ambition stated beforehand:
    A number of emergening and future technologies have the potential to transform - for better or for worse - society and the conditions for humanity. These include, e.g., geoengineering, artificial intelligence, nanotechnology, and ways to enhance human capabilities by genetic, pharmaceutical or electronic means. In order to avoid a situation where in effect we run blindfolded at full speed into unknown and dangerous territories, we need to understand what the possible and probable future scenarios are, with respect to these technological developments and their potential positive and negative impacts on humanity. The purpose of the meeting is to shed light on these issues and discuss how a more systematic treatment might be possible.
Discussions focused not only on possible outcomes, but to some exent also on what we might do to improve the odds of an outcome favorable to humanity. Some of the speakers mentioned the possibility of prohibiting certain lines of research judged to pose particularly severe risks for global catastrophes - not as the only way forward, but as one of several possible strategies worth considering; in particular, Roman Yampolskiy, in his talk based on the paper Responses to Catastrophic AGI Risk: A Survey coauthored with Kaj Sotala, discussed a very wide range of such strategies for the case of artificial intelligence. Still, the mere mentioning of the possibility of a ban seemed to be enough to agitate a couple of members of the audience, including science journalist Waldemar Ingdahl, who tweeted about it. In an attempt to elicit a clarification of his point of view, I responded to his tweet, leading to the following discussion:
    WI: Many calls to shut down free research at KVA today

    OH: Are you agitated by that, or just making a slightly amusing observation?

    WI: like others in the audience and some of the speakers at the KVA event, I found calls to shut down free research worrying

    OH: Shutdowns should not be done frivolously, but reflecting on it when the future of humanity is at stake should not be taboo.

    OH: Here's my take on it: http://haggstrom.blogspot.se/2011/10/angaende-akademisk-frihet-en.html

    WI: shutdowns of free research tend to spread to other areas, see the fate of Swedish GMO and biotech research. That's worrying.

    OH: Yes, it's worrying. This worry needs to be weighed against others, e.g., new research leading to extinction of humanity.

Unfortunately, Ingdahl left our exchange at that point. I say "unfortunately", because it is still not clear to me what Ingdahl's position on this issue really is. I see a number of possibilities, including the following, for how he, depending on his position, might respond:
    (1) Granted, there may be conflicting ideals to balance there. I just wanted to remind you guys that there are serious downsides to banning research.

    (2) Why do you keep pestering me about this? I've already demonstrated a downside to banning research. Such a demonstration is enough to show that banning research is wrong.

    (3) Freedom of research is more important than the survival of humanity.

    (4) As a liberal (or a libertarian) I consider freedom, including academic freedom, a fundamental thing that I am under no circumstances willing to negotiate away.

    (5) The future will always be uncertain and dangerous, and we will never know enough about what a future technology can bring us to warrant a ban.

If Ingdahl's response is (1), then we are in fact in agreement. Response (2), on the other hand, is a simple (but, it seems to me, not uncommon) mistake: the fact that a course of action A has downsides is not automatically a decisive argument against A, because not doing A might have even worse downsides. Response (3) reflects a value judgement that I strongly disagree with - while I do think freedom of research is an important thing, I think the survival and long-term prospects of humanity is even more important. Response (4) reflects a position that can be considered a special case of (3), and that involves a praticular mistake, namely the failure to recognize that an unconditional call for the simultaneous enjoyment of all kinds of freedom collapses due to the observation (made earlier on this blog) that various freedoms are in conflict with each other. In this case, there may, e.g., be a conflict between on one hand freedom of research, and on the other hand the freedom to live on without being slaughtered by a killer robot or a synthetic killer virus.

Response (5) has some merit, as the consequences of future radical technologies are notoriously difficult to predict, but I think its conclusion goes way too far. Given the enormity of what's at stake, I think we have an imperative to try to act with as much foresight as we possibly can, which is precisely why discussions like those at the KVA meeting last Monday (and research projects like those of its main speakers) are so badly needed. And it is certainly not the case that we can never know anything about future technology and its consequences. We do not know at present what the best course of action is, but we should be openminded in trying to figure out an answer. To blindly declare at this stage that we will never find ourselves in a position that calls for a research ban seems just silly to me.

It may of course very well be that I've totally misunderstood Ingdahl, and that his actual position on this issue resembles none of the five alternatives I've sketched. I hope he will tell us.

tisdag 18 mars 2014

Om Åke Ortmark

Med tanke på min förra bloggpost Om Vladimir Putin finns risken att den jag nu författar uppfattas som del två i en storsatsning rubricerad t.ex. Herrar jag inte gillar. Någon sådan satsning föreligger dock inte, och jag hoppas inom kort återkomma till mer uppbyggliga ämnen. Och det skall genast sägas att jag tycker klart bättre om den legendariske svenske journalisten Åke Ortmark än om Vladimir Putin. Stormförtjust är jag emellertid inte.

Skälet till min bristande förtjusning är framför allt den självtillräckliga mallighet (vilken han ibland söker maskera med påklistrat ödmjuk självkritik) med vilken Ortmark torgför sina ofta ganska extrema åsikter - en mallighet som paras med ett direkt förakt för ovälkomna vetenskapliga resultat (särskilt på klimatområdet) och för oss som i våra politiska ställningstaganden fäster vikt vid sådant som social rättvisa och omsorg om kommande generationer. Jag läser om honom i en stort uppslagen intervju (ej tillgänglig elektroniskt) i senaste numret av den högerorienterade tidsrkiften Neo. Två citat ur intervjun får illustrera dessa hans osympatiska drag. Först ett där han tillskriver sina meningsmotståndare psykisk sjukdom:
    När TV2 startade 1969 flyttade Ortmark dit, men kanalen var så präglad av vänstervågen att han snart var tillbaka på TV1 igen.

    - Man kunde se hur enkelt det är att ryckas med i psykiska ohälsor som sprider sig genom våra opinioner och den offentliga debatten. Sextioåtta var förfärligt på det sättet, och vi rycktes alla med i viss utsträckning. Var man vänster blev man ännu mer vänster, och var man höger hamnade man i högerns vänsterfalang.

Nästa citat är typiskt för hans konspirationsteoretiskt anstrukna klimatförnekeri:
    SVT klarar inte att leverera opartisk samhällsbeskrivning, särskilt inte i klimatfrågan, menar [Ortmark].

    - Där har public service svikit sin roll. Som när man gjorde reklam för ett avsnitt av Agenda med frågan om det finns 'en plan B för att rädda klimatet' - då bedriver man opinionsbildning som är upprörande i sin ensidighet. Fullständigt upprörande!

    Klimatet blir en tacksam förevändning för dem som vill reglera och kontrollera ekonomin av andra skäl, menar han. Och för dem som redan är övertygade om att internationella organ som FN måste får mer makt. De kan utnyttja människors oro för klimatförändringar.

Ortmark och jag satt under en tid mot slutet av 00-talet tillsammans i Humanisternas förbundsstyrelse, vilket visade sig en smula olyckligt. Styrelsearbetet tyngdes under ett antal månader av att jag upptäckt hur Ortmark vid sidan av sitt Humanisterna-engagemang ägnade sig åt att sprida pseudovetenskaplig propaganda, något jag förklarade mig anse oförenligt med förtroendeuppdrag i Humanisterna, vilket i sin tur fick Ortmark att högtidligt deklarera att han inte längre kunde tänka sig att sitta ned vid samma sammanträdesbord som jag. I oktober 2008, kort före sammanbrottet, höll vi (i ett välmenande men dödsdömt försök från ordförande Christer Sturmark att lappa ihop meningsmotsättningarna) ett internt klimatseminarium,1 varifrån jag gärna återger (fritt ur minnet, och liksom minst en gång tidigare) följande replikskifte.

Ortmark ondgjorde sig över den "vidskepelse" som hans ansåg att oro över globalt sinande naturresurser innebar. Han gjorde den med all sannolikhet korrekta observationen att en naturresurs som t.ex. olja aldrig kommer att ta slut i den bokstavliga meningen att den allra sista droppen konsumerats, men drog den enligt min mening ogrundande slutsatsen att marknadens lagar om tillgång och efterfrågan innebar en garanti för att sinande naturresurser aldrig skulle kunna bli ett samhällsproblem. Vi hade påtagliga svårigheter att förstå varandras ståndpunkter, och i ett halvt desperat försök att hitta någon gemensam grund att utgå ifrån föreslog jag att "vi lever på en ändlig planet, det kan vi väl ändå vara överens om?". "Där har vi det", replikerade Ortmark triumferande, "det är precis den inställningen som gör att vi inte kan mötas i denna fråga!".

Fotnot

1) Jag utveckalde därefter mitt bidrag till seminariet i vad som kom att bli ett av mina mest uppmärksammade skriftliga inlägg i klimatdebatten.

lördag 15 mars 2014

Om Vladimir Putin

Även om jag ibland gör ansatser här på bloggen att lyfta frågor som jag finner ohyggligt viktiga men som i stort sett ignoreras i det offentliga samtalet, så gör jag inga som helst anspråk på att prioritera vilka aktuella världshändelser som är viktigast och som starkast påkallar vår uppmärksamhet. Jag skriver glatt om oviktiga saker som schack-VM, du-reformens efterdyningar och en gammal Pepsodentreklam, samtidigt som jag inte med ett ord nämner vare sig kriget i Syrien eller tyfonen Haiyans katastrofala framfart över Filippinerna i november förra året. Jag har helt enkelt inte ambitionen att erbjuda den sortens välbalanserad nyhetsbevakning.

Ändå - i största korthet - här är något jag inte tycker att jag kan tiga om hur länge som helst: Rysslands president Vladimir Putin utgör personligen, med sin maktfullkomlighet och sina geopolitiska ambitioner, ett av de största hoten mot världsfreden på mycket länge. Det är inte fel att (som mer framstående debattörer än jag gjort) jämföra dagens Putin med 1930-talets Adolf Hitler.

Timothy Snyders text Fascism, Russia and Ukraine i senaste New York Review of Books är visserligen författad den 19 februari, någon vecka före det ryska militära intåget på Krimhalvön, men ger en mycket läsvärd, intressant och förfärande inblick i Putins och hans nära rådgivare den fascist-stalinist-eurasianistiske statsvetaren Aleksandr Dugins tankevärld. Lika förfärande läsning är det referat från en putinsk presskonferens häromveckan som den rysk-amerikanska journalisten Julia Ioffe publicerade i New Republic och som pekar mot att Putin är på väg att alldeles förlora förståndet.

Putin är verkligen en fasansfull politiker och en vedervärdig person. Det enda positiva om honom jag kan komma på att - för balansens skull - lyfta fram skall väl i så fall vara hans framträdande roll som gay-ikon (vilken dock står i bisarr kontrast mot hans syn på homosexuellas rättigheter).

Vi bör emellertid vara noga med att inte låta våra berättigade antipatier mot Vladimir Putin spilla över i något slags generell antipati mot ryssar i allmänhet. Se t.ex. dagens hoppingivande rapportering om protester i Moskva mot Rysslands kränkningar av ukrainskt territorium. Den ryske förre schackvärldsmästaren Garri Kasparovs twitterflöde om rysk politik och oppositionen mot Putin är också värt att följa.

torsdag 13 mars 2014

Om några av reaktionerna på Bygrenincidenten

Då jag häromveckan bloggade över ämnet Om statistisk signifikans, epigenetik och de norrbottniska farmödrarna väckte det lite större genklang än vanligt. Antalet sidvisningar för just det blogginlägget klättrade snabbt till tre gånger det tidigare rekordet för mina bloggposter, samtidigt som mitt inlägg kommenterades flitigt på Facebook och Twitter, liksom i bloggpostens eget kommentarsfält. Jag tänkte idag ge korta reflektioner kring några av dessa reaktioner.

Vad det hela handlar om är det jag här kallar "Bygrenincidenten" - hur en grupp forskare på Karolinska Institutet med professor Lars-Olov Bygren i spetsen lyckades publicera en undermålig epigenetisk studie i den vetenskapliga tidskriften BMC Genetics, och samtidigt få uppmärksamhet i exempelvis DN för sina påstådda (men ogrundade) slutsatser, varefter jag i ovan nämnda bloggpost i rättframma ordalag förklarade det fatala felet i studiens statistiska analys. Felet Bygren et al begår är att de inte tar hänsyn till den så kallade multipelsignifikansproblematik som uppstår då man gör mer än ett hypotestest; se sagda bloggpost (inklusive den mycket pedagogiska xkcd-stripp som finns inklippt) för en närmare förklaring, som kan ses som nödvändig förkunskap för följande diskussion.

De flesta som hört av sig i bloggpostens kommentarsfält instämmer i min analys. Bortsett från ett par mindre välbetänkta kommentarer från Anonym 12:19 respektive Anonym 11:47 vilka går ut på att biologi och statistik inte är samma sak (helt riktigt!) och att jag som statistiker därför inte har kompetens att yttra mig om den statistiska analysen i en biologiuppsats (en helt orimlig slutsats!), så var där egentligen bara en person som på allvar ifrågasatte mitt resonemang, nämligen Arvid Sjölander, forskarassistent i biostatistik vid Karolinska Institutet. Hans ifrågasättande resulterade i ett ganska långt och bitvis intressant meningsutbyte honom och mig emellan.

Sjölander inleddde med att efterfråga ett knivskarpt kriterium för när man behöver multipelsignifikansjustera och när man inte behöver göra det. Jag svarade att jag inte tror att hans fråga fullödigt kan besvaras med "enkla och svart-vita regler som kan följas robotaktigt för att dra rätt slutsats i varje enskild situation" - det kommer alltid att finnas gråzoner och gränsfall där forskarens goda omdöme behöver komma till användning. Men för att påvisa att Bygren et al inte är något sådant gränsfall, utan utgör statistikmissbruk "bortom varje gråzon", formulerade jag följande metodregel, som jag senare i diskussionen döpte till M 17:42:
    Ett vetenskapligt arbete som (a) bekänner sig till det frekventistiska hypotestestningsparadigmet, och (b) gör anspråk på att förkasta en nollhypotes H, är tvungen att påvisa (eller åtminstone troliggöra) att om H vore sann så skulle sannolikheten att förkasta den med den brukade metoden vara låg.
Det fina med formuleringen av denna regel är att den torde vara okontroversiell för alla statistiker oavsett statistikfilosofisk inriktning - frekventisten ansluter sig till den närmast per definition, medan t.ex. en bayesian inte uppfyller (a) och därför inte kan ha problem med regeln. Jag förklarade också på vad sätt Bygren et al bryter mot metodregeln:
    Bygrens et al artikel är så genomsyrad av p-värdesexcersis att vi utan vidare kan konstatera att (a) gäller. Det är också helt klart att (b) gäller, med H={det finns inga samband mellan mor- och farföräldrars mattillgång under förpuberteten och deras barnbarns dödlighet i hjärt- och kärlsjukdomar}, dvs de gör anspråk på att ha stark evidens mot denna hypotes. Emellertid är sannolikheten att förkasta H (om den är sann) med deras metod alls inte låg. Med den orimligt välvilliga tolkningen att de utropar "Vi har stark evidens mot H!" endast om något av deras 24 p-värden blir högst 0,016, så ger Bonferronis metod att sannolikheten att förkasta H blir högst 0,384, vilket alls icke är någon låg sannolikhet. (Möjligen går Bonferroniskattningen att pressa ned något, men det förefaller som ett intrikat problem då testen [...] inte är oberoende, och författarna gör hur som helst ingen ansats i den riktningen.) Troligare förefaller dock, för den som läser artikeln, att författarna hade utropat "Vi har stark evidens mot H!" så snart något av deras 24 p-värden blir högst 0,05. Bonferronis övre skattning av sannolikheten att förkasta H (om H är sann) blir då 24*0,05=1,2, vilket förvisso kan trunkeras ned till 1, men 1 är likväl inte någon låg sannolikhet.

    Bygrens at al arbete bryter alltså mot [M 17:42], och kan därför dömas ut som dålig vetenskap - dålig bortom varje gråzon.

Sjölander sade sig acceptera metodregeln M 17:42, men var ändå inte övertygad eftersom han tyckte sig se ett kryphål för Bygren et al, i det att regelns tal om "den brukade metoden" kan tolkas på olika sätt. Bygren et al kan enligt Sjölander definiera "den brukade metoden" som beräkningen av ett p-värde - en metod som de sedan upprepade 24 gånger, utan att någon gång bryta mot M 17:42.1 Detta gjorde mig en smula bestört, varför jag framhöll (vilket möjligen inte var optimalt för samtalsklimatet) att en sådan argumentation bara kan tas på allvar av den som ser vetenskapen mindre som ett sökande efter sanningen än som jakten på karriärbefrämjande p-värden, och jag karikerade hans tankegång på följande vis:
    "Aha, M 17:42 preciserar inte vad som menas med 'metod'. Då gäller det att hitta ett sätt att tolka 'metod' så att Bygren et al kommer undan med sina slutsatser. Låt oss säga att deras metod är att utföra ett test av nollhypotesen H, och att de sedan upprepar denna metod 24 gånger. Om vi sedan envist insisterar på att upprepandet av denna metod 24 gånger inte i sig utgör en 'metod', då har vi faktiskt konstruerat ett försvar för att Bygren et al hållit sig inom spelreglerna, vilket ju är kanonbra eftersom de därmed kan stoltsera med ett hyggligt p-värde för något riktigt sensationellt, vilket är karriärbefrämjande."
Eftersom Sjölander tidigare i diskussionen vägrat svara på huruvida hans avsikt verkligen var att "försvar[a] Bygren et al, eller om [han] spelar djävulens advokat", så efterfrågade jag ett tydligt ställningstagande från hans sida om huruvida Bygren et al handskats rätt eller fel med sina data. Det tydligaste han kunde leverera var att han
    håller med om att Bygren et al tenderar att övertolka. Specifikt, i sammanfattningen skriver de ”Conclusion: The shock of change in food availability seems to give specific transgenerational responses”. Jag hade inte vågat sammanfatta resultaten på det sättet. [...]

    Så sammanfattningsvis: nej, jag tycker inte att Bygrens artikel är helt bra. Men jag tycker inte heller att den är tillräckligt dålig för att motivera kraftuttryck som [...] ”dålig bortom varje gråzon”.

Det var i själva verket mitt missnöje med dessa försiktiga formuleringar ("tenderar att övertolka", där ord som "tokfel", "falsarium" eller "uppåt väggarna" enligt min mening hade passat bättre), vilka jag tolkade som att Sjölander ändå tyckte att Bygrens et al statistikbehandling befann sig i något slags gråzon, som fick mig att brista ut i ovanstående karikatyr.2 I sin avslutande (?) kommentar valde Sjölander dock att avhålla sig från fortsatta antydningar om att det skulle finnas något gråzonsaktigt i Bygrens et al handskande med statistiken. Istället framhöll han att det i en empirisk studie som denna finns så mycket annat än just den statistiska analysen och de statistiska slutsatserna att bedöma - exempelvis datainsamling och etikprövningsnämndskorrespondens - vilka (såvitt Sjölander kunde se) hanterats utmärkt, varför mitt helhetsomdöme "dålig bortom varje gråzon" tydde på att jag "har lite svårt att uppfatta och förhålla [mig] till nyanser". (Eventuellt bör också den klanderfria stavningen och interpunktionen i artikeln räknas till Bygrens et al fördel.) Själv insisterar jag på att det här med att man skall ha empiriskt stöd i sina åberopade data för de slutsatser man hävdar är så centralt för ett empiriskt inriktat vetenskapligt arbete att om sådant stöd alldeles saknas så kan inget annat rädda arbetet från att räknas som "dåligt bortom varje gråzon".

Nog om mitt meningsutbyte med Arvid Sjölander. I efterdyningarna till Bygrenincidenten och min bloggpost kom även ett par utspel i mainstreammedia där kända vetenskapsjournalister försökte sig på den svåra pedagogiska uppgiften att förklara multipelsignifikansproblematiken för en bredare allmänhet: Ulrika Björkstén på Vetenskapsradion och Karin Bojs i DN.3

Uppmärksamheten i mainstreammedia resulterade sedan i en del ytterligare reaktioner i bloggosfären - en del vettiga, andra mindre vettiga. Låt mig som kuriosa (eller närmast lyteskomik) nämna hur exempellöst fånig den bloggpost är som Lars Kamél, bloggande klimatförnekarfåntratt,4,5 författat med anledning av Karin Bojs DN-kolumn, där han bland annat skriver följande:
    En annan märklig person som nämns i [Karin Bojs]6 artikel är Olle Häggström, professor i statistik och en person som aldrig reagerar på felaktiga användning av statistiska metoder inom klimatvetenskap, men tydligen gör det inom vissa andra områden.

    Både [Bojs] och Häggström är klimathotstroende och sådana anser att andra kriterier gäller för klimatvetenskap än i annan naturvetenskap. Det ser vi gång på gång.

På typiskt klimatförnekarvis är Kamél här inte bara fånig, utan ytterst vårdslös med fakta. Det han skriver om mig är osant. Jag anser inte att "andra [vetenskaplighets-]kriterier gäller för klimatvetenskap än i annan naturvetenskap", och det är inte sant att jag "aldrig reagerar på felaktiga användning av statistiska metoder inom klimatvetenskap". Tvärtom är klimatvetenskapen snarast överrepresenterad bland mina då och då förekommande små utfall mot felaktigt bruk av statistiska metoder. Här är tre exempel:
  • I Axess 7/2010 dömer jag ut den hemmagjorda statistiska metod som används i en artikel av David Douglass, John Christy, Benjamin Pearson och Fred Singer i International Journal of Climatology:
      Artikelns resultat står och faller med en användning av det statistiska redskapet konfidensintervall som är så uppåt väggarna att jag skulle ha slitit mitt hår i förtvivlan om jag ertappat någon av mina Chalmersstudenter med att göra något liknande.
  • I en recensionUppsalainitiativet 2011 av klimatforskaren Raymond Bradleys bok Global Warming and Political Intimidation riktar jag kritik mot hur Bardley och hans medförfattare i en berömd artikel från 1999 tillämpar så kallad principalkomponentanalys:
      Mann, Bradley och Hughes använde sig, till följd av deras ofullkomliga kunskaper i statistisk slutledningsteori, av en klart olämplig normaliseringsmetod i tillämpandet av den statistiska procedur som kallas principalkomponentanalys, något som mycket väl hade kunnat resultera i missvisande slutsatser. Jag finner det osnyggt av Bradley att försöka bagatellisera detta statistiska metodfel och, genom att jämföra det med diskrepensen mellan hans vana att låta havregrynsgröten stå 1 minut och 35 sekunder i mikrovågnsugnen kontra de 1:40 som havregrynspaketet anbefaller, framställa det hela som en smaksak.
  • I min artikel Why the empirical sciences need statistics so desperately (publicerad i en konferensproceedingsvolym förra året) kritiserar jag i Avsnitt 3 klimatforskaren Phil Jones för att han inlåter sig i en p-värdesexcercis implicit baserad på så orealistiska antaganden att den blir till en ren ritual utan vetenskapligt värde.7

Fotnoter

1) Sjölander utvecklade också sitt argument på följande vis:
    Vi kan invända att Bygrens definition ter sig orimlig, givet att han faktiskt har beräknat 24 p-värden i en och samma artikel. Men om nu Bygren hade skrivit 24 artiklar istället för en, med 1 p-värde i varje, så ter sig hans definition helt rimlig, i alla fall för mig.
Det som Sjölander här beskriver som "helt rimlig[t]" är dock enligt min uppfattning (vilket framgår av min nästa replik i meningsutbytet) totalt orimligt. Gissningsvis ändrade sig dock Sjölander på denna punkt, med tanke på dels att vi till slut verkade vara överens om att det är de relevanta vetenskapliga sammanhangen och inte uppdelningen i publiceringar som styr när man skall multipelsignifikansjustera, dels att han längre fram i diskussionen skrev att han "håller med om att Bygren et al tenderar att övertolka".

2) Sjölanders lite undanglidande diskussionsstil gör att jag inte förmår avgöra om det alltjämt återstår någon meningsskiljaktighet honom och mig emellan rörande hur allavrligt det fel är som Bygren et al begår i sin statistiska analys, eller om det bara är hans vårdade språk som får honom att skriva "tenderar att övertolka" istället för "tokfel".

3) Bojs gav i sin artikel credit till mig för att ha avslöjat och förklarat Bygrens et al statistikmissbruk, medan Björkstén av någon anledning valde att inte göra det (trots att det var först efter att ha rådgjort med mig som Vetenskapsradion valde att inte slå på stora trumman för Bygrens et al påstådda resultat).

4) Som ett exempel på den bottenlöst låga nivån på de Kamélska fånerierna, se t.ex. hur han använder begränsningar i analogin mellan växthusets glastak och koldioxidens värmande effekt till att så dubier om det senare.

5) En och annan läsare kanske tycker att jag borde undvika ord som "fånig" och "fåntratt", men eftersom Kamél faktiskt är en fåntratt, samtidigt som jag själv är en närmast principiell motståndare till att såsa till diskussionen med otydlighetsskapande diplomatisk fetvadd, kan förekomsten av de lite sandlådeaktigt klingande orden i detta sammanhang inte hjälpas. (Se även min utläggning om ordet "klimatförnekare".)

6) Kamél ogillar att Bojs inte delar hans konspirationsteorier om att klimatvetenskapen är en enda stor bluff, och använder därför inte hennes riktiga namn, utan ett öknamn han hittat på. Den nivån vill jag inte förfalla till här: Lars Kamél heter såvitt jag vet Lars Kamél på riktigt.

7) Se även Avsnitt 5.1 i samma artikel, där jag går loss mot klimatforskaren Maarten Ambaums förvirrade försök att övertyga sina ämneskollegor om det olämpliga i begreppet statistisk signifikans.

måndag 10 mars 2014

Gästinlägg av Bo Berndtsson: Om den senaste universitetsrankingen

Alltmer vikt verkar numera fästas vid de olika globala universitetsrankingar som med jämna mellanrum presenteras, varav den så kallade Shanghairankingen blivit mest känd. En annan av dem, Times Higher Education World Reputation Rankings, gav häromdagen eko i svenska media, där det ansågs alarmerande att ett par välkända svenska universitet halkat utanför listan. Min Chalmerskollega Bo Berndtsson har tittat närmare på denna ranking, och det är härmed mitt stora nöje att presentera hans sågning av densamma som ett gästinlägg här på bloggen. /OH

* * *

Om den senaste universitetsrankingen

Förra veckan kom ännu en larmrapport om det svenska utbildningssystemet. I radio och tidningar rapporterades på framskjuten plats om att svenska lärosäten tappar i anseende - Uppsala och Lund har petats från topp hundra-listan över världens främsta universitet. Rapporteringen utgick från en nypublicerad undersökning av Times Higher Education. Få verkar ha ställt sig frågan hur undersökningen är gjord och om man verkligen kan dra några slutsatser från den.

Låt oss först konstatera att Times Higher Education gör två olika undersökningar, World University Rankings och World Reputation Rankings. Den första av dessa är åtminstone någorlunda seriös och jag skall återkomma till den lite längre ned. Det är den andra, Reputation Ranking, som de senaste larmrapporterna är baserad på, och den är inte seriös alls. Så här är den gjord:

Times Higher Education, eller rättare sagt Thomson Reuters som är det analysföretag som gjort enkäten, har helt enkelt frågat ett antal forskare vilka de anser vara världens 15 främsta universitet. Rankningslistan är gjord så att högskolorna rankas efter hur många röster de fått. Nummer 1 (Harvard) har sedan tilldelats poängantalet 100, och ett universitet som fått, säg, en tiondel så många röster som Harvard har fått 100/10=10 poäng. Det är allt!

Det är lätt att föreställa sig vilket resultat en sådan metodik ger. Enda möjligheten att få poäng är ju att någon forskare, någonstans därute, anser att man hör till de femton bästa. Det är ingenting som man kan räkna med skall hända alls i ett land som har någon promille av världens befolkning. Om de som svarat på enkäten är omdömesgilla (se mina farhågor på den punkten nedan) kan man räkna med att ett universitet som i någon reell mening ligger på plats femtio inte får några röster alls. Den som vill kan ju jämföra med vilket resultat en liknande undersökning om vilka som är Sveriges främsta idrottare, eller ännu hellre, vilka som är världens hundra största städer skulle ge.

Ja, låt oss fundera ett ögonblick hur det skulle gå om någon ville sammanställa en rankningslista över världens största städer, genom att be 1000 personer ange vilka städer de tycker är de femton största. Om de som svarar på enkäten var seriösa så skulle de femton städer som verkligen är störst få 1000 röster var. Ingen annan skulle få någon röst. I verkligheten skulle det förmodligen bli lite brus, några skulle ha fel om vilka städer som är störst, några skulle kanske tolka frågan fel och någon kanske skulle svara på skoj. Därför skulle resultatet i realiteten bli att de femton största bara skulle få nästan alla röster, och sedan skulle det finnas en snabbt avtagande svans. T ex skulle kanske någon från Arboga ta med den staden i sitt svar och det skulle kanske räcka för att komma med på topp hundra-listan. Då skulle Svenska Dagbladet skriva: "Ny undersökning visar: Arboga bland världens största städer."

I alla händelser skulle det här exemplet förmodligen inte ge särskilt pålitliga resultat på plats hundra, och det tror jag inte att Times undersökning har gjort heller. Man kan också se att poängantalet rasar mycket snabbt från 100 på plats 1, till 6.5 på plats 50. På lägre placeringar har Times valt att inte publicera poängantalet - säkerligen för att de extremt låga talen på plats 100 skulle visa metodikens problem så tydligt.

Times skriver att resultatet är baserat på "the considered expert judgement of senior, published academics - the people best placed to know the most about excellence in our universities". Tillåt mig att tvivla. Jag kan tänka mig att det finns två typer av forskare som gör sig besväret att svar på en så här korkad enkät. 1. De som inte har något bättre att göra. 2. De som tror att de kan påverka resultatet i för dem önskad riktning. Ingen av dessa grupper är särskilt lämpad för uppgiften.

Det stämmer till eftertanke att den här eländiga undersökningen har kunnat få så mycket uppmärksamhet, bland politiker, lederskribenter och i nyhetsrapporteringen. Senast i raden är Svenska Dagbladets chef för ledaravdelningen, Tove Lifvendal, som kallar rapporten "en av de mest prestigefyllda universitetsrankningarna i världen". Hon citerar också undersökningschefen, Phil Baty, som kallar det "ett slag mot Sveriges globala status att två av landets mest prominenta universitet faller ur listan". Lifvendals artikel betraktar jag som ett olycksfall i arbetet - det är omöjligt att göra en egen detaljkoll av alla fakta som rusar förbi. Phil Baty däremot framstår som en ren humbug; han måste rimligen själv begripa något av vad han håller på med.

Det återstår då Times andra lista, World University Rankings. Den utgår ifrån ett flertal olika indikatorer, varav 'reputation' bara är en. Man kan ha många synpunkter på hur rättvisande den är men det är inget som jag tänker gå in på här. Jag vill bara i rättvisans namn tillägga att också här har verkligen både Uppsala och Lund rasat de senaste åren. Å andra sidan har placeringen av KTH och Stockholms Universitet gått upp ungefär lika mycket. Inte heller den undersökningen verkar alltså ge något fog för slutsatsen att svenska universitet tappar, däremot reser den kanske en del andra frågor.

torsdag 6 mars 2014

Anders Sandberg om artificiell intelligens och mänsklighetens framtid

En av huvudtalarna på det KVA-möte i Stockholm den 17 mars som bär rubriken Emerging technologies and the future of humanity (missa inte sista anmälningsdag 10 mars!) och som jag gjorde reklam för i en tidigare bloggpost är Anders Sandberg från Future of Humanity Institute i Oxford. Anders har alltid spännande saker att säga, och för den som inte kan bärga sig till den 17:e finns följande videoinspelning av det föredrag Artificial intelligence: examining the interface between brain and machine som han höll i Oxford för en knapp månad sedan.

I kallelsen till samma föredrag kan vi ta del av en kort-kort sammanfattning:
    Artificial intelligence may seem the preserve of science fiction books and films, but how close are we to genuine artificial intelligence, and will it look as we expect it to? From mind uploading to self-replicating machines, Dr Anders Sandberg will explore what artificial intelligence will mean for humanity, and how we can navigate the inevitable risks it will bring.

måndag 3 mars 2014

Parallella universa enligt Tegmark

Teorier om parallella universa handlar om att vårt synliga universum inte är allt som finns. Vårt universum är kanske blott ett bland många i ett väldigt mycket större multiversum. Det finns multiversumteorier av många olika slag, och den svenskfödde MIT-kosmologen Max Tegmark delar i sin aktuella bok Our Mathematical Universe in dem i fyra nivåer. Nivå I går ut på att det fysiska rummet och förekomsten av materia sträcker långt bortom det synliga universum. I Nivå II är rummet separerat på ett sådant sätt att de fundamentala naturkonstanterna antar olika värden i olika delar (något som i kombination med så kallade observationsselektionseffekter kan tänkas besvara det notoriska finjusteringsproblemet). Nivå III är Hugh Everetts många världar-tolkning av kvantmekaniken. Dessa tre nivåer av multiversumteorier har vunnit relativt stor spridning och acceptans (om än långt ifrån någon konsensus) bland kosmologer och fysiker. Annat är det med Nivå IV, som är Tegmarks egen teori om ett matematiskt baserat multiversum, där varje matematisk struktur existerar som ett eget universum parallellt med alla andra. I sitt förfäktande av denna teori, som likställer fysisk existens med matematisk, stöter han på rejält motstånd från sina forskarkollegor. Två uppmärksammade reaktioner på Our Mathematical Universe exemplifierar detta - en bloggpost av Peter Woit och en recension i New York Times av Edward Frenkel. Båda är starkt kritiska, och Woit går klart över gränsen till det nedlåtande.1 Det som retar upp både Woit och Frenkel är att Tegmark går så långt i sina spekulationer att han enligt deras mening hamnar utanför vad som kan kallas naturvetenskap. Istället hamnar han i något som snarare är att betrakta som filosofi, vilket (om jag nu får tillåta mig att tolka Woit och Frenkel en smula fritt) tydligen är dåligt.

Själv är jag mycket positiv till Tegmarks bok.2 Jag håller med Woit och Frenkel om att han går långt i sina spekulationer - så långt att han nog får anses ha överträtt gränsen mellan naturvetenskap och filosofi. Jag anser dock inte att det nödvändigtvis ligger något fel i detta, så länge man är tydlig över vad som är vad. Tegmark är föredömligt tydlig med vad som är mainstreamvetenskap (som hans utförliga och mycket intressanta redogörelse för den moderna kosmologins framväxt och var den står idag), vad som är något mindre etablerat, och vad som är hans egna tämligen sjövilda spekulationer. Och jag anser att frågan om universums (eller multiversums) fundamentala beskaffenhet är intressant och viktig, och finner det troligt att vi inte kan hitta fram till sanningen om detta med mindre än att en och annan forskare på Tegmarks vis tar sig friheten att söka sig långt utanför den etablerade boxen. Jag finner det en smula inskränkt att kräva att de spekulationer dessa pionjärer därvid levererar redan från början uppfyller alla gängse vetenskaplighetskrav om poppersk falsifierbarhet och liknande (Tegmark argumeterar för sina Nivå IV-teoriers falsifierbarhet, men övertygar inte riktigt på denna punkt). Sådant kan (förhoppningsvis) mejslas fram över tid.

Tegmarks idé om att varje matematisk struktur också har en fysisk existens i form av ett parallellt universum är inte alldeles lätt att ta till sig, och jag kan inte påstå att jag tillräckligt väl begriper vad den innebär för att jag skall kunna svara på om jag tror på den eller inte. Jag vill dock berätta om hur jag för någon månad sedan, under några nästan euforiska ögonblick, fick en stark förnimmelse av att idén är både begriplig och sann, snudd på självklar. Jag åt lunch med min snillrike ( och här på bloggen välkände) Chalmerskollega Johan Wästlund, och följande samtal utspelade sig. Min aha-upplevelse grundade sig troligen inte bara i själva samtalet, utan också i att jag hade i sammanhanget precis rätt uppsättning förkunskaper och förutfattade meningar. Därför är det troligt att flertalet läsare inte kommer att dela min aha-känsla, men inför möjligheten att en och annan faktiskt kanske gör det vill jag ändå återge samtalet:3
    JW: Du vet där där besvärliga frågan om varför det finns någonting, istället för ingenting...?

    OH: Ja...?

    JW: Tänk dig situationen att ingenting finns, inte ens vakuum, inte ens tid och rum.

    OH: Jag känner alltid ett visst obehag, lite som att befinna sig i fritt fall, inför den tanken. Men OK, jag tänker mig att ingenting finns.

    JW: Bra. Är det i den situationen ändå sant att det finns oändligt många primtal?

    OH: Hmm... jag brukar ju tänka mig att matematiska sanningar är oberoende av vad som existerar fysiskt, men den situation du beskriver är så extrem att jag blir lite osäker.

    JW: Men vi vet ju båda att det finns oändligt många primtal, och att detta faktum knappast kan bero på hur vårt fysiska universum är beskaffat. Säg ja!

    OH: OK... ja.

    JW: Bra. Men om vi accepterar att primtalen existerar även i ett totalt tomt universum, då måste väl rimligtvis detsamma gälla även för Conway's Game of Life, med alla dess gliders, kanoner och självreproducerande strukturer?

    OH: Javisst, självklart! Det vore ju helt orimligt att dra en gräns någonstans mellan primtalen och Game of Life för vad som existerar.

    JW: Bra. Men om Conway's Game of Life existerar, då måste väl av samma skäl även vi existera?

    OH: Hm... ja! Visst är det så! Naturligtvis är det så!

Fotnoter

1) Som trogna läsare av denna blogg säkert anat så tycker jag inte att det är fel att ta till en lätt nedlåtande ton när man tycker att något är riktigt riktigt dåligt. Men jag blir lite förbryllad när jag jämför Woits bloggpost med hans recension i Wall Street Journal, där tonläget är närmast respektfullt. Det är uppenbart att Woit brister i uppriktighet i minst en av dessa texter.

2) Så positiv är jag att jag med varm entusiasm är beredd att rekommendera boken för t.ex. en ung student som går och grubblar över om en forskarkarriär är rätt sak för henne att satsa på. Tegmarks har en smittande hänförelse för vetenskapen, boken är lättläst, och han väver in självbiografiska små episoder som ger framställningen extra liv (men som i hans ogenerösa meningsmotståndares ögon tycks framstå som ännu ett irritationsmonent).

3) Jag citerar fritt ur minnet. Johan är välkommen att korrigera mig om han finner att jag avvikit på något väsentligt vis från vad som faktiskt sades.