tisdag 4 augusti 2015

Lambertz laborerar med pseudokvantiteter

I min bloggpost Quickologisk sannolikhetskalkyl den 16 maj i år diskuterade jag den centrala passage i Göran Lambertz bok Quickologi, i vilken författaren gör anspråk på att medelst en sannolikhetsberäkning påvisa att morddomarna mot Thomas Quick var riktiga. Jämte många andra fel i Lambertz framställning påvisade jag att den räkneregel för betingade sannolikheter som han implicit byggde hela sin kalkyl på inte gäller.1

Det stod tidigt klart att Lambertz tagit del av min kritik [WebCite], men det var först häromdagen som han presenterade en korrigering av sin kalkyl i ljuset av denna kritik [WebCite]. Det kan i förstone förefalla glädjande att han är beredd att rätta till den kalkyl som han har fått förklarat för sig är felaktig, men tyvärr visar det sig att hans korrigering är ytterst halvhjärtat genomförd. Ovillig att skiljas från sin felaktiga räkneregel för betingade sannolikheter löser han det hela med att helt enkelt döpa om de kvantiteter han laborerar med: det han i boken kallade sannolikheter kallar han nu "bevisvärde". I boken hade han på s 296 en passage med ordalydelsen...
    I tabellen nedan står hundra (100) för hundraprocentig sannolikhet, vilket i praktiken ofta är detsamma som faktisk vetskap. Jag sätter noll (0) för ingen sannolikhet alls. Femtio (50) innebär att man gör bedömningen att omständigheten i sig innebär att sannolikheten är 50 procent för att personen är skyldig (se exemplet med de båda misstänkta, A och B, på sidan 275). Tio (10) betyder på motsvarande sätt att man gör bedömningen att omständigheten i sig innebär att sannolikheten är 10 procent för att personen är skyldig.
...vilken han nu ändrat [WebCite] till följande:
    I tabellen nedan står hundra (100) för fullt bevis, vilket i praktiken ofta är detsamma som faktisk vetskap. Jag sätter noll (0) för inget bevisvärde alls. Femtio (50) innebär att värdet hos beviset, när det används för att visa att personen är skyldig, ligger mitt emellan 0 och 100 (jfr mordet med de båda misstänkta, A och B, ovan). Tio (10) betyder på motsvarande sätt att värdet hos beviset, när det används för att visa att personen är skyldig, är 10 % av fullt bevis.
Detta ger väldigt lite ledning (vare sig i teorin eller i praktiken) i hur man ansätter ett "bevisvärde" till en omständighet, och läsaren lämnas helt i sticket vad gäller hur "bevisvärde" egentligen skiljer sig från det gängse sannolikhetsbegreppet.2 Detta är synnerligen otillfredsställande, ty Lambertz verkar mena att han glatt kan behandla "bevisvärde" med den räkneregel som jag påvisade var så åt helskotta fel för sannolikheter, varför vi behöver dels en klar och redig definition av "bevisvärde", dels en argumentation för varför den lambertzka räkneregeln skulle vara giltig för dessa kvantiteter. Något sådant finner vi inte i hans framställning. De exempel jag gav i maj (vilka enkelt kan mångfaldigas) på varför räkneregeln fallerar för sannolikheter verkar fungera som motexempel även då sannolikheterna ersätts med "bevisvärde".3,4 Det ser faktiskt inte bättre ut än att Lambertz (önske-)tänker sig att hans felaktiga resonemang i boken plötsligt och magiskt blir korrekt om blott han byter ut delar av terminologin.

Vad Lambertz i praktiken gör i sin kalkyl är följande. För varje enskild bevisomständighet höftar han till med en siffra som läsaren inte ges någon susning om var den kommer ifrån (oavsett om den betecknas som sannolikhet eller som "bevisvärde"). Därefter tillämpar han en räkneregel (additivitet för de bevisvärdessiffror han höftat till med) som läsaren inte meddelas någon som helst motivering till varför den skulle vara giltig, och så postulerar han, helt out of the blue, att långtgående slutsatser om Thomas Quicks skuld kan dras om den därvid erhållna summan kraftigt överstiger 100%. Jag kan inte se att denna sifferexercis tillför något jämfört med om Lambertz hade valt att presentera sin lista över bevisomständigheter utan några sifferangivelser, att peka ut vilka av dem han tycker väger mycket tungt (eller måttligt tungt, eller relativt lätt, etc), och att i ord konkludera att han tycker att den sammantagna bevisningen tyder på att Quick är skyldig. Genom att klämma till med (lite godtyckliga) siffror, och behandla dessa med en (lite godtycklig) räkneregel, ger han ett bedrägligt intryck av precision i sitt resonemang, och de kvantiteter han laborerar med är i själva verket vad Sven-Eric Liedman döpt till pseudokvantiteter.5 Det slags användande av matematik som Lambertz här ägnar sig åt är något jag med emfas vill fördöma. Matematik skall användas för att ge det slags precision som rent verbala resonemang inte klarar av - inte för att medelst sken av precision få resonemang att verka mer övertygande och imponerande än de faktiskt förtjänar.

*

Det ovanstående är mitt huvudsakliga skäl till varför jag inte finner Lambertz korrigerande text [WebCite] utgöra något framsteg i förhållande till den felaktiga sannolikhetskalkyl han presenterar i boken. Jag vill inte ödsla tid och kraft på att påpeka alla de övriga fel han begår i den nya texten, utöver på ett par punkter där han trots allt dristar sig till att diskutera sannolikheter:
  • I början av den som rättelse avsedda texten skriver Lambertz följande:
      Sannolikhetsvärden kan, rent matematiskt, inte adderas. De ska i stället multipliceras enligt formeln 1-(1-p)(1-p), där p är sannolikheten för det enskilda beviset.
    Det här är så gott som meningslös rappakalja, som bara tjänar till att demonstrera Lambertz avgrundsdjupa okunskap i sannolikhetsteori. Givetis kan sannolikhetsvärden adderas, och de kan adderas "rent matematiskt" (vad nu detta tillägg är tänkt att tillföra) - frågan är bara hur summan kan tolkas. Vad gäller Lambertz uttryck 1-(1-p)(1-p) så försummar han att tala om vad detta uttryck är tänkt att stå för, och hans påstående blir därför meningslöst. Lägg också märke till att han uttalar sig om sannolikhetsvärden, i pluralis, men att det i uttrycket 1-(1-p)(1-p) bara förekommer en variabel, betecknad p. Min bästa gissning om vad Lambertz menar är att han betecknar den ena sannolikheten med p, och den andra (också!) med p - vilket i så fall är en grad av bristande matematisk tankereda man sällan ser i tryck. Och min bästa gissning rörande varifrån han fått sitt uttryck är att det handlar om teorin för så kallat oberoende händelser: För två händelser A och B har vi att
      P(A och B) = P(A)P(B)
    och att
      P(A eller B) = 1 - (1-P(A))(1-P(B))
    - förutsatt att vi talar om oberoende händelser.6

    På tal om addition av sannolikheter finns för övrigt en annan klass av händelser där P(A eller B) fås genom just addition av P(A) och P(B). Jag talar här om disjunkta, dvs ömsesidigt uteslutande, händelser för vilka vi alltså har att P(A eller B) = P(A)+P(B). Blåvitt och Elfsborg kan inte båda vinna Allsvenskan 2015 (deras respektive segrar är disjunkta händelser), varför sannolikheten att något av de båda lagen vinner Allsvenskan 2015 fås som summan av lagens respektive segersannolikheter.

  • I den nu aktuella rättelsetextens [WebCite] allra sista stycke tar Lambertz upp sannolikheten för att Quick är oskyldig, givet ett par specifika bevisomständigheter som han behandlar i separata rättelsetexter: de beryktade likhundarna [WebCite], och det nästan lika beryktade kunskapstestet av Sven Åke Christianson [WebCite]. Det finns väldigt mycket att invända mot Lambertz evidensvärdering och sannolikhetsanalys i dessa fall, men ett elementärt klavertramp som han i båda fallen begår är det som kallas the fallacy of the transposed conditional: att för två händelser A och B förväxla P(A|B) med P(B|A).7 Tvärtemot vad Lambertz vårdslösa sifferhantering tycks vilja göra gällande, så är sannolikheten för Quicks oskuld givet en viss bevisomständighet inte detsamma som sannolikheten för denna bevisomständighet givet Quicks oskuld.

Fotnoter

1) För att kort rekapitulera vad jag påpekade i maj: Det är helt enkelt inte sant att betingade sannolikheter uppfyller additivitetsegenskapen
    P(A|Ei, Ej) = P(A|Ei) + P(A|Ej).
Ej heller är det oftast sant, eller approximativt sant. Eller som jag skrev i maj:
    Det går att koka ihop enstaka exempel på händelser A, Ei och Ej där additivitetsformeln råkar stämma, men då är det att betrakta mer som en tillfällighet än som konsekvensen av en allmän egenskap hos betingade sannolikheter.

2) Vad gäller "mordet med de båda misstänkta, A och B, ovan" finner den som söker högre upp i Lambertz korrigerade text [WebCite] inget omnämnande av A och B, så jag kan bara anta att "ovan" syftar på s 275 i boken, där Lambertz förklarar att A och B har sannolikhet 50% vardera att vara skyldig till ett visst mord. I det här fallet sammanfaller alltså "bevisvärde" med sannolikhet, men om Lambertz på allvar menar att "bevisvärde" inte bara är en synonym till sannolikhet hade det varit mer belysande om han givit ett exempel där dessa kvantiteter skiljer sig åt.

3) Detta givetvis sagt med reservation för att jag inte vet vad "bevisvärde" egentligen är, då ju Lambertz inte förklarat saken.

4) Följande stycke i Lambertz korrigerade text tyder på att han faktiskt tagit visst intryck av Fotnot 7 i Quickologisk sannolikhetskalkyl:
    Man måste dock vara försiktig med denna metod och inte tro att den ger några exakta, eller ens alltid rättvisande, besked. Det visar sig om man t.ex. adderar en mängd bevis som var för sig har ett relativt lågt bevisvärde. Kommer man då upp i 100 därför att bevisen är många (exempelvis en hel hop vittnen som alla är lite osäkra), måste man vara varsam.

5) I en recension av Liedmans bok Hets kan vi läsa att
    en pseudokvantitet har en kvantitets alla yttre kännetecken men saknar dess avgörande positiva egenskap, att exaktare än varje försök till beskrivning med enbart ord karakterisera ett objekt eller en relation mellan objekt.

6) Vi talar alltså här om det sannolikhetsteoriska obereondebegreppet. Jag vill å det bestämdaste avråda läsare på lambertzk kunskapsnivå från att ta för givet att händelser eller kvantiteter som är oberoende i logisk eller någon mer vardaglig mening automatiskt också är det i sannolikhetsteoretisk mening - don't try this at home!

7) Sådan förväxling kan leda till hur felaktiga sannolikhetsuppskattningar som helst; se t.ex. Fotnot 3 i min bloggpost från den 27 februari i år. För ytterligare diskussion om the fallacy of the transposed conditional rekommenderar jag min populärvetenskapliga framställning i Nämnaren 1/2013.

Edit 4 augusti 2015 kl 21:35: Göran Lambertz har skrivit ett utförligt svar [WebCite] till denna bloggpost.

Edit 8 augusti 2015: Nu har Göran Lambertz gjort en omfattande revision [WebCite] av den korrigeringstext jag kritiserar i denna bloggpost. För att texten ovan skall bli begriplig är det därför nödvändigt att genomgående konsultera WebCite-versionen av den oreviderade korrigeringstexten snarare än "original-länken" till (den nu reviderade) korrigeringstexten.

I den nya revisionen har Lambertz återgått (om än inte helt konsekvent) i sin terminologi från "bevisvärde" till sannolikhet. Han har övergivit sitt additionsförfarande, till förmån för ett multiplikationsförfarande som han tycker är så förträffligt att han ser sig föranledd att proklamera att han genomfört sin analys "på ett matematiskt i huvudsak korrekt sätt", men dessa stolta ord är dessvärre alldeles ogrundade. Lambertz tycks mena att om A är händelsen att Quick är skyldig, och om Ei och Ej är två olika bevisomständigheter, så gäller det multiplikativa sambandet
    P(A|Ei, Ej) = 1-(1-P(A|Ei))(1-P(A|Ej))
förutsatt att Ei och Ej uppfyller något visst oberoendevillkor L som han dock dessvärre inte preciserar ordentligt. Jag går bet på att lista ut vilket detta villkor L skulle vara; såväl vanligt obetingat oberoende som betingat oberoende givet A eller betingat oberoende givet Quicks oskuld ¬A visar sig vara otillräckligt för att garantera den önskade multiplikativiteten. Saken blir inte bättre av hans besynnerliga ad hoc-hantering av de negativa "sannolikheter" som redan från början är mäkta besynnerliga, och texten innehåller därtill en del ytterligare underligheter. Jag vet inte riktigt hur jag skall kunna sammanfatta denna nya version av den quickologiska sannolikhetskalkylen utan att jag riskerar att få nya ebrev från Lambertz med uppläxning rörande vad som är lämpligt språkbruk för en "professor och representant för Chalmers, med de anspråk på seriositet som samhället ställer på en sådan person" (citat ur ebrev från Lambertz till mig den 6 augusti i år), men "rena rappakaljan" vore helt klart ett i sammanhanget träffande uttryck.

14 kommentarer:

  1. Man kunde sammanfatta Lambertz resonemang så här:
    Antag att Quick är skyldig. Alltså är han skyldig.

    En "samhällets stöttepelare" bör vara klarsynt nog att inte vilseföra sig själv med sina egna resonemang.

    SvaraRadera
  2. Ett tips till Lambertz: Bayesianska nätverk. Och det finns gott om kodbibliotek och programvaror som ger stöd för att använda sådana.

    SvaraRadera
    Svar
    1. Lars förslag är troligen den bästa vägen framåt för den som vill kvnatifiera evidensläget i rättsfall som detta. Men jag vill även här utfärda min don't try this at home-varning från Fotnot 6. Att sätta avancerd programvara för bayesianska nätverk i händerna på någon som inte konceptuellt behärskar begrepp som oberoende, betingning, prior och Bayes sats är lite grand som att sätta en skarpladdad Kalashnikov i händerna på en fyraåring.

      Radera
    2. Och där gjorde han just det, han begick bayesiska övningar.

      Radera
  3. Inte fullt övertygad, men sannolikt övertygad, 81,3% närmare bestämt6 augusti 2015 08:14

    Jurister lär sig inom grundutbildningen en del om sannolikhetsuppsåt. För de som vill ha en genomgång kan läsa Per Olof Ekelöfs serie Rättegång. Har vi tur har nu en jättelik forskningsmöjlighet uppenbarat sig, med ett tvärvetenskapligt forskningsprogram där matematiken uppfostrar juridiken. Då kanske juridiken kan få en matematisk uppstramning som de gamla professorerna sökte, av matematiker för jurister. Juridikens hantverkare som inte läst naturvetenskap på gymnasiet eller därefter kan även få en inblick i när deras resonemang klampar in på helt fel områden. Den rättsvetenskapliga avgränsningen, skulle man kunna omformulera det hela till. Anläggs sedan ett genusperspektiv har man hela regeringen med sig.

    SvaraRadera
  4. Det är tydligt i Göran Lambertz svar på Olle Häggströms bloggpost ovan att Göran Lambertz inte förstått begreppet oberoende (i sannolikhetsteorins mening) och att han heller inte förstått att det finns något i det sammanhanget som han har missat. Han tror att han har förstått det.

    Det är mycket farligt.

    Man kan säga att "Lambertz och andra borde inte hålla med sånt som de inte kan", etc, men det duger inte. Sannolikhetsteoretiska resonemang kan inte undvikas i rättegångar och andra mänskliga sammanhang, och de som fattar viktiga beslut kan inte alla vara matematiker. Jag tror att Göran Lambertz är uppriktig när han ger intryck av att han faktiskt vill förstå och göra rätt (Göran: jag har just läst något som en klimatförnekare skrivit, så jag hade tankarna på folk som ljuger utan skämmas). Så: hur förklarar man begreppet obeoroende i sannolikhetsteorins mening på ett kortfattat och lättbegripligt sätt? Det är viktigt.

    SvaraRadera
  5. Det är som Dan Hedlin säger. Sannolikhetsteoretiska resonemang kan inte undvikas i rättsväsendet, och de allra flesta av oss jurister är ganska dåliga på matematik. Vi behöver därför hjälp för att bli bättre, och för att på så sätt kunna kvalitetshöja den bevisprövning som ofta är en viktig del av den dömande verksamheten. I det nu aktuella sammanhanget har jag sett ett behov av att om möjligt använda siffror som hjälp för att illustrera bevissituationen i Quickmålen. Jag inser att en förståelse av oberoendebegreppet är ett nödvändigt steg på vägen för att kunna göra detta på ett matematiskt acceptabelt sätt.Jag har fått ett tips av Olle H om att läsa Peter Olofssons "Probabilities: The Little Numbers that Rule Our Lives", och jag hoppas komma en bit med hjälp av den. Om någon av er har tid och lust att hjälpa mig (och på sikt hela rättsväsendet) att förstå hur vi kan räkna för att ge ett hyggligt närmevärde för den samlade bevisningen, givet att vi kan sätta ett värde på varje enskilt bevis, är jag mycket tacksam. Det innebär att jag är mycket glad för konstruktiva förslag angående ändringar i det avsnitt i min bok som nu finns på min hemsida, www.goranlambertx.se, under Extramaterialet, p. 10, "Bevisvärderingen i siffror". Min epostadress är glambertz@hotmail.com, om någon skulle ha tid och lust. Tack i så fall!

    SvaraRadera
    Svar
    1. Å ena sidan hävdar Lambertz TQ´s skuld bland annat utifrån i sin bok och blogg presenterade sannolikhetsberäkning... (som av matematikprofessorn summerats som "rappakalja") å andra sidan vill Lambertz ha hjälp med att förstå hur han ska räkna för att ge ett hyggligt närmevärde för den samlade bevisningen.
      Det hade varit förståeligt om Lambertz först lyssnat och lärt sig sammanhangen mellan matematiken och bevisvärderingen innan han hävdat TQ skuld bland annat utfrån matematisk sannolikhetsberäkning.

      Radera
    2. Hej Göran
      Jag försöker ta mig tid under veckan och skriver till din hotmailadress
      hälsningar
      dan

      Radera
  6. Hej Göran,

    Jag har en fundering kring användingen av Bayes sannolikheter inom juridik. Jurister (Obs: jag är själv naturvetare) verkar använda sig av begreppet "bevisvärde", som de definierar som P(E|H)/P(E|-H) där E är här "bevis för hypotes H. Om jag har förstått rätt är det samma sak som "sann positiv" / "falsk positiv", ett slags odds. Det jag har sett publicerats runt Quick är att man ofta har bortsett från betydelsen av falska positiva vid värderingen av bevis. En domstol tar ofta ställning till vittnens och andra bevis värdering, något som med nödvändighet är subjektivt. Att då använda betingade sannolikheter som Lambertz citerar leder till nonens, det är helt klart. Jag hade förmånen att träffa en jurist med kunskaper inom sannolikhetsteori förra året, och han efterlyste en mycket bättre dialog mellan matematiker och jurister. Det vore intressant att höra dina synpunkter som statistiker om praxis inom domstolsväsendet och hur man skulle kunna öka kunskaperna här.

    En annan sak som jag är nyfken på är följande: Har det gjorts studier på jämförelser mellan Dempster-Shafer teori och klassisk Bayes teori inom juridik? Inom mitt yrke har jag stött på en variant av D-S som kallas TBM, Transferrable Belief theory, som i vissa situationer är mer användbar än vanlig Bayes. Det vore intressant att höra mer om dina synpunkter här.

    Mvh,
    Sören

    SvaraRadera
  7. Min kommentar var ägnad till Olle, inte Göran. Ber om ursäkt...

    SvaraRadera
    Svar
    1. Om parxis inom domstolsväsendet vet jag nästan ingenting, och kan därför inte säga så mycket som svar på din fråga. Ända sedan jag för över tio år sedan blev klar över vilken fruktansvärd rättsskandal som i Nederländerna drabbade sjuksköterskan Lucia de Berk har jag dock haft en stark känsla av att behovet av verklig statistisk och sannolikhetsteoretisk expertis inom rättsväsendet är stort men otillfredsställt, och Göran Lambertz charlatanerier på detta område stärker min uppfattning på denna punkt.

      Radera
  8. Det verkar som om Lambertz sifferlek saknar en viktig ingrediens: har det verkligen skett ett mord? Om det gäller fallen Johan och Therese så är de båda barnen försvunna. Att i de fallen räkna med sannolikheter eller bevisvärden blir då fullständigt meningslöst, inte sant?

    SvaraRadera