fredag 18 mars 2016

On the fallacy of the transposed conditional

To all my colleagues in the academic discipline of mathematical statistics

We all know about the fallacy of the transposed conditional: to confuse P(A|B) with P(B|A), for instance by mistaking the probability of the obtained data given the null hypothesis for the probability of the null hypothesis given the data. And of course we know better than to fall for that fallacy. But not all of our colleagues who represent other academic disciplines, and who need to do statistics in their daily dealings with empirical data, are as sophisticated statistical thinkers as we are. Many of them are prone to slip into that very fallacy. So can we please please agree to avoid language that encourages them to do so? In particular, can we agree to never ever use ``θ is likely to be 0.7´´ as shorthand for ``the likelihood function L(θ) takes a relatively large value for θ=0.7´´? Please?

14 kommentarer:

  1. It is well know that 90% of non-statisticians commit the fallacy of the transposed conditional. So if somebody commits that fallacy, one can be 90% certain that he/she is not a statistician.

    SvaraRadera
    Svar
    1. Äntligen ett exempel jag förstår och kommer att minnas (efter som det var så roligt!)

      /Icke-statistiken

      Radera
  2. Finns det någon svensk term för "likelihood function"? Sannolikhetsfunktion är väl "probability function"?

    SvaraRadera
    Svar
    1. Försök har gjorts på Chalmers att införa trolighetsfunktion, om än med måttlig framgång. Det vanligaste torde alltjämt vara att man säger likelihoodfunktion.

      Radera
    2. OK, tack. Ja, trolighet är väl den bästa översättningen. Googlade lite, och såg att man på KI översätter det till sannolikhetsfunktion.

      http://beta.mesh.kib.ki.se/term/D016013/likelihood-functions

      Inte helt lyckat, kanske?

      Radera
    3. Statistikfrämjandet tycker att likelihood ska översättas till likelihood:

      http://statistikframjandet.se/etisk-kod/ordlista/

      Radera
    4. Jag är böjd att instämma med Statistikfrämjandet på denna punkt.

      Radera
  3. Om θ står för fysikaliska grundparametrar som t ex Higgspartikelns massa, så är det tveksamt om man öht ens kan tala om en sannolikhetsfunktion för θ på ett meningsfullt sätt. Om P(x|θ) beskriver sannolikheten för experimentella utfall x, så finns det öht ingen meningsfull tolkning av P(θ,x).

    Fast det är kanske en helt annan diskussion?

    xkcd: Frequentists vs Bayesians

    SvaraRadera
    Svar
    1. För en Bayesian är det utmärkt meningsfullt.

      Radera
    2. På tal om detta, har du skrivit något längre om Fischerianer vs. Bayesrare? Är det en konstruerad eller verklig konflikt? Kan man inte bara använda olika metoder i olika situationer?

      Radera
    3. Nej tyvärr Mattias, jag har ju inte riktigt det, även om Kapitel 6 (och i synnerhet Avsnitt 6.8) i min nya bok tar upp en del om saken, och jag snuddade vid ämnet i en bloggpost i januari 2013.

      Radera
    4. Tack, skall kolla upp det.

      Radera
  4. Karolinska Institutet tackar för informationen och uppdaterar sin MeSH.

    SvaraRadera