– Man kan ikke gå på fisketur i tallene, og så, når man skal formidle resultatene til andre, late som om man startet med en hypotese som man så har fått bekreftet, sier Jan-Ole Hesselberg.(Illustrasjonsfoto: Andrei Armiagov, Shutterstock, NTB)
Fisker du i tallene?
PODCAST: – En enkel definisjon av de statistiske begrepene som alle kan forstå på første forsøk? Det tror jeg ikke finnes, sier psykolog Jan-Ole Hesselberg.
JoRøislienPODCASTER
Publisert
Å teste hypoteser ved hjelp av tall er en del av den vitenskapelige grunnmuren. Men hva skjer om vi snur det hele på hodet? At heller enn å samle inn tall for å teste en hypotese, så starter vi med tallene og leter rundt i dem og ser hva vi finner? Vel, da kan det hele gå skikkelig, skikkelig galt.
I denne episoden av statistikk-podkasten Nakne Tall snakker statistiker Jo Røislien med psykolog Jan-Ole Hesselberg om farene ved å lete rundt i et tallmateriale etter signifikante resultater.
Tema for den sjette episoden av Nakne Tall er p-verdier: Statistikkens kanskje mest brukte – og misbrukte – tall. Tallet som forteller om det er sannsynlig at tallmaterialet vi har samlet inn støtter hypotesen vi hadde om verden eller ikke.
Om Nakne Tall
Nakne Tall er
en podkast om statistikk. Hvordan kan man bruke tall til å forstå hvordan
verden henger sammen? Statistiker Jo Røislien inviterer kjente forskere og
formidlere til samtaler med utgangspunkt i sentrale statistiske begreper og
fenomener.
Podkasten
består av ni episoder, og ligger gratis tilgjengelig på Spotify, Apple Podcasts
og andre platformer. Nakne Tall er utviklet av Jo Røislien og
produksjonsselskapet Teddy, og produsert av Universitetet i Stavanger.
– P-verdier er det tallet forskere baserer flest av konklusjonene sine på – samtidig som det er det tallet de strever mest med å forstå, sier statistiker Kathrine Frey Frøslie i podkastens faste ekspertpanel.
P-verdiene som kommer ut av de statistiske analysene er uløselig knyttet til hypotesetesting, der vi starter med en hypotese, samler inn tall som bevismateriale og så regner på disse med en statistisk test.
Ofte kan det være fristende å gjøre det motsatte, nemlig starte med tallene og lete rundt etter statistiske sammenhenger. Men da bryter man egentlig med hele premisset for den statistiske testingen. Og resultatene blir tilsvarende langt mindre troverdige.
– Det er lov å lete rundt i tallene, sier Hesselberg.
– Man må ikke alltid ha en hypotese om hva det er man leter etter. Men da må man også fortelle at det er det man har gjort. Man kan ikke gå på fisketur i tallene og så, når man skal formidle resultatene til andre, late som om man startet med en hypotese som man så har fått bekreftet.