- Sometimes, on learning that I am a philosopher, a non-philosopher who has gained the impression that it is difficult to get agreement in philosophy will tease me with the idea that philosophy can never definitely establish anything. I then like to point out to my would-be tormentor that he has just unwittingly provided me with all the material I need to refute that very thesis. For the idea that it is impossible definitely to establish any philosophical thesis is itself a substantive philosophical thesis. Therefore we can definitely establish that if my interlocutor ever definitely established his thesis that it is impossible definitely to establish any philosophical thesis, then in establishing his thesis, he would have refuted it. Thus we can definitely establish that one can never definitely establish that one can never definitely establish anything in philosophy. So we can definitely establish something philosophical.
En medborgare och matematiker ger synpunkter på samhällsfrågor, litteratur och vetenskap.
torsdag 26 mars 2015
Kan filosofiska frågor någonsin besvaras slutgiltigt?
söndag 22 mars 2015
I skottlinjen för rättshaveristiska utgjutelser
- (1) I den första av sina båda bloggposter söker han tillbakavisa mitt påstående att välgrundade val av stickprovsstorlek kräver NHST-statistikens begreppsapparat,2 och framhåller följande:
- First of all, bigger sample sizes are always better (all other things equal) for accurately estimating the population parameters under study (unless we are using NHST in which case big sample sizes cause studies to be overpowered). So an initial rule of thumb for sample size decisions might be "as many as you can afford and have the time for".
(2) Emil Karlsson avslutar sin andra bloggpost i ämnet med att hävda att jag inte lyckats producera något exempel där NHST:s begreppsapparat är oundgänglig. Det kan ju låta som en utmaning som jag borde besvara, men jag lider något av en embarrassment of riches eftersom NHST-begrepp behövs inom merparten av all frekventistisk statistisk slutledningsteori, inklusive det av Emil Karlsson omhuldade bruket av konfidensintervall. Låt mig dock nämna ett annat exempel, nämligen studier av multipelinferenskaraktär, dvs sådana där mer än en statistisk slutledning görs. Att i sådana studier komma fram till om de erhållna resultaten avviker från vad som typiskt skulle vara fallet om alla effektstorlekar vore noll skulle i de flesta fall vara extremt klunsigt och besvärligt om man förbjöds laborera med p-värden. Ett exempel är den KI-studie om epigenetik som Emil Karlsson själv nyligen var med och diskuterade här på bloggen. Med sin begränsade förståelse för NHST-statistik var han dessvärre oförmögen att se det som för den som är van vid p-värdesberäkningar är uppenbart: att studiens erhållna resultat var helt i linje med vad som kan förväntas om ingen epigenetiska nedärvning förekommer, och därför inte kan tolkas som evidens för existensen av sådan nedärvning.
(3) I sin andra bloggpost i ämnet skriver Emil Karlsson också att "Häggström seems to be under the impression that if he can find rare and complicated counterexamples, he can undermine the entire case for confidence intervals". Förutom hans ogrundade "rare and complicated" är hans framställning av min stånpunkt en - excuse my French - ren jävla halmgubbe. I exakt den passage han kritiserar i min bloggpost Geoff Cummings dansande p-värden framhåller jag ju att det i vissa sammanhang finns goda skäl för användandet av konfidensintervall:
- Cumming har helt klart en poäng i att det ofta kan vara mer upplysande att redovisa sina vetenskapliga resultat i termer av konfidensintervall jämfört med att bara uppge p-värden.
(4) Ett annan ohederlighet som Emil Karlsson begår i sin andra bloggpost är följande:
- Even more bizarrely, some people (including Häggström) thinks that a failure to reject the null hypotheses means that you can accept it, apparently selectively oblivious (going so far as to call it semantical hairsplitting) to the fact that the failure to reject the null hypothesis could be due to low statistical power and not because it is true.
- Betyder den uteblivna statistiska signifikansen att vi kan dra slutsatsen att
nollhypotesen ̈ar sann och att myntet alltså är symmetriskt? Svar nej! Den uteblivna statistiska signifikansen betyder bara att erhållna data (2 krona av 10) inte talar särskilt starkt emot nollhypotesen
q=0,5. Men det finns en uppsjö andra hypoteser som data inte heller talar emot, som t.ex. den att
q=0,2, eller den att q=0,3, etc.
- there are formal statistical methods (described in Cumming (2012)) for calculating suitable sample sizes in order to get an expected length of confidence intervals (precision) at least a certain percent of the time (assurance). Notice that no part of precision or assurance arguments about sample size relates to doing a statistical test or talking about null hypotheses, so this is not "just secretly doing NHST".
- (a) Angående Emil Karlssons bisarra anklagelse att jag skulle tro att "failure to reject the null hypotheses" innebär att nollhypotesen kan slås fast såsom sann konstaterar jag i punkt (4) ovan att han "förväxlar den formella användningen inom NHST-teorin av ordet 'acceptera' med en av ordets mer vardagliga betydelser". På det svarar han nu följande:
- Häggström responds by insisting that he really meant "accept" in a non-statistical sense and not at all the way the term is used in NHST and that he certainly does not believe that statistical non-significance implies the falsehood of the null hypothesis.
(b) Längre fram i Emil Karlssons bloggpost kan vi läsa följande:
- Häggström implicitly quoted R. A. Fischer when claiming that statistical significance either means that the null hypothesis is false or that something unlikely has happened. This is false, as large sample sizes can yield statistical significance for even minute differences that could be observed with high probability even if the null hypothesis was true.
fredag 20 mars 2015
Geoff Cummings dansande p-värden
-
1. Vad gäller Cummings insats ur pedagogisk, presentationsteknisk och retorisk synvinkel kan jag inte annat göra än att lyfta på hatten - ett riktigt mästerstycke!
2. Cumming har helt klart en poäng i att det ofta kan vara mer upplysande att redovisa sina vetenskapliga resultat i termer av konfidensintervall jämfört med att bara uppge p-värden. I ett enkelt renodlat exempel som det Cumming presenterar är det en utmärkt idé, men någon universell mirakelmedicin är det inte. Att beräkna ett konfidensintervall inbegriper motsvarigheten till beräknande av p-värden för alla möjliga parametervärden samtidigt, och i mer komplicerade sammanhang (inte minst då mer än en okänd parameter föreligger) visar detta sig ofta vara matematiskt ogörligt och/eller leda till långt mer komplicerade och svårtolkade konfidensmängder än de snälla intervall som fås i videon.
3. Den p-värdesdans som Cumming demonstrerar i videon är följden av en kombination av måttlig effektstorlek och litet stickprov. Om det stämmer, som Cumming säger, att simuleringens effekt- och stickprovsstorlek är typiska för empiriska studier i psykologi, så anser jag att den viktigaste lärdomen av hans exempel inte handlar om att det skulle vara något fel på p-värdesbegreppet i sig. Snarare är lärdomen denna: att psykologer behöver bli mer stringenta i sina så kallade styrkeanalyser, vilket betyder att de behöver se till att deras stickprov är tillräckligt stora för att någorlunda tillförlitligt kunna detektera rimliga nivåer på effektstorleken. (Detsamma kan sägas om ekonomen Robert Östlings simuleringsexempel på Ekonomistas häromsistens.)
4. I den högljudda skara av mestadels statistikteoretiskt okunniga anti-p-värdesfundamentalister som jublar över ovan nämnda BASP-tilltag att bannlysa p-värden är det många som hänvisar till Cummings video. Även om det vore fel att lasta Cumming för alla fåraktigheter som yttrats i denna diskussion, så har han med sina svepande generaliseringar (t.ex. "For a typical experiment, p tells you virtually nothing", 6:50 in i videon) helt klart uppmuntrat till en del dumheter. Ett typexempel, som fått stor spridning, är följande yttrande av neurologen Steven Novella:
- Another problem with the p-value is that it is not highly replicable. This is demonstrated nicely by Geoff Cumming as illustrated with a video. He shows, using computer simulation, that if one study achieves a p-value of 0.05, this does not predict that an exact replication will also yield the same p-value.
5. Det finns mycket kritiskt att säga om hur p-värden och statistisk signifikans används och tolkas i praktiken på många områden. Viktigt är emellertid att inte kasta ut barnet med badvattnet. Det är vantolkningarna och det felaktiga bruket av p-värden och statistisk signifikans som bör bekämpas, inte begreppen själva, som ofta erbjuder mycket viktiga statistiska redskap. En (i övrigt värdefull och intressant) bok som begår samma barn-med-badvattensutkastning som BASP-redaktionen är Stephen Ziliaks och Deirdre McCloskeys The Cult of Statistical Significance från 2008. I min recension av den boken sammanfattade jag min syn på saken så här:
- The Cult of Statistical Significance is written in an entertaining and polemical style. Sometimes the authors push their position a bit far, such as when they ask themselves: "If null-hypothesis significance testing is as idiotic as we and its other critics have so long believed, how on earth has it survived?" (p. 240). Granted, the single-minded focus on statistical significance that they label sizeless science is bad practice. Still, to throw out the use of significance tests would be a mistake, considering how often it is a crucial tool for concluding with confidence that what we see really is a pattern, as opposed to just noise. For a data set to provide reasonable evidence of an important deviation from the null hypothesis, we typically need both statistical and subject-matter significance.
onsdag 18 mars 2015
Chappie!
måndag 16 mars 2015
Hur okunnig och korkad kan en professor i vetenskapsfilosofi bli?
- En liknande nivå håller Nordin då han går vidare från sitt klimatförnekeri till att ifrågasätta mänsklig påverkan på ozonskiktet. I en bloggpost från förra månaden rapporterar han triumferande att någon minskning av ozonhålet över Antarktis inte kunnat konstateras sedan undertecknandet 1987 av Montrealprotokollet rörande utsläpp av ozonnedbrytande ämnen. Som signaturen Thomas (en av ytterst få ljuspunkter på The Climate Scam) påpekar så "är det inte konstigt med långlivade kemikalier som kan finnas kvar i atmosfären långt efter det att vi minskat utsläppen". Nordin svarar att "det är möjligt. Men när nödvändigheten av Montrealprotokollet diskuterades så var det ingen som sa att det skulle dröja 50 år eller så innan man skulle märka någon skillnad". Inför Thomas förklaring att "hade det inte varit för stoppet så hade CFC-halterna fortsätt stiga i atmosfären och situationen fortsatt bli värre" har Nordin inget att tillägga.
-
Peter F: Men så bra då. Nu kan alla AGWare lägga ner verksamheten och börja syssla med nåt vettigare.
http://www.dn.se/goda-nyheter/varldens-koldioxidutslapp-okar-inte/
Sigge: Att koldioxidutsläppen inte ökar trots stor ekonomisk tillväxt beror väl mycket på AGW-larmen.
Förra året ökade elproduktionen från vindkraft med ungefär 100 TWh och från vattenkraft med ungefär lika mycket. Hade det varit 200 TWh kolkraft istället så hade koldioxidutsläppen varit ungefär 0,2 mdr ton större.
Ingemar Nordin: Hmmm, har jag förstått det här rätt: 2014 var alltså enligt vissa källor det varmaste året. Och samtidigt så har CO2-produktiionen stått still.
Kan det finnas något samband tro? :-D
Sigge: Nej, Du har inte fattat rätt! Förra året släpptes det ut 32,3 mdr ton CO2 i atmosfären vilket gör att CO2-halten i atmosfären fortsatte att öka.
Ingemar Nordin: ??? Nu blev det ännu konstigare. Så du menar att CO2-halten ökade tack vare att människan inte ökade sin CO2-produktion?
Sigge: För att inte förvirra saken ytterligare så gäller det att inte blanda ihop begreppen.
Du skrev i ditt inlägg #115 att CO2-produktionen stått still. Det är ju inte sant för när en produktion står stilla så producerar den 0. Nu var produktionstakten konstant jämfört med året innan.
Om CO2-produktionen fortsättningsvis kommer att vara på runt 32 mdr ton/år så kommer CO2-halten i atmosfären att öka tills ett jämviktsläge nås. Om det jämviktsläget är 420, 450, 500 ppm eller rentav ännu högre har jag ingen kunskap om.
Ingemar Nordin: Jomen nu var det inte jämvikten som står i fokus här utan CO2-halten. Om mänskligheten inte tillskjuter mer CO2 till atmosfären än året före dess så borde halten vara konstant. Men du säger att den borde öka. Hur då? Varifrån kommer de extra tonnen i år med CO2 som inte fanns där året innan?
Sigge: Det tillfördes 32 mdr ton koldioxid förra året från fossila bränslen. Vi har ungefär 400 ppm CO2 i atmosfären nu. Vid den CO2-halten förbrukar naturen mer CO2 än vad den producerar men skillnaden är mindre än 32 mdr ton som är de antropogena utsläppen. Om jag tog lite tid på mig att räkna skulle jag kunna räkna ut hur mycket mer CO2 naturen tar upp än som produceras vid den CO2-halt vi har nu. Att däremot räkna ut jamviktsläget är svårare, för att det påverkas av parametrar som jag är dåligt insatt i hur de storleksmässigt påverkas av klimatförändringarna. Om fossila CO2-tillskottet i atmosfären ligger stabilt under ett antal år så kanske det kommer att märkas om några år att ökningen av CO2-halten går långsammare.
Ingemar Nordin: Synd att du inte räknat ut hur mycket mer CO2 naturen producerar så att halten ökar trots att människan inte tillför mer.
fredag 13 mars 2015
Mitt föredrag i Saltsjöbaden om mänsklighetens eventuella undergång
torsdag 12 mars 2015
Eftersläntrande utvandrare
söndag 8 mars 2015
Trolleyologi: en hedonistisk variant
måndag 2 mars 2015
Är statistik tråkigt?