Det er forskjell på noen og alle. Derfor stemmer ikke meningsmålinger alltid overens med det som blir resultatet etter et valg.(Foto: Gorm Kallestad, NTB)
Når noen er bedre enn mange
PODCAST: – Jeg har et nært og intimt forhold til konfidensintervaller, sier valgforsker Johannes Bergh.
JoRøislienPODCASTER
Publisert
Nesten uansett hva vi undersøker, er det sjelden vi har
mulighet til å sjekke absolutt alt og alle. Det er rett og slett for
ressurskrevende. Vi blir nødt til å nøye oss med noen. Og det at vi lar noen
representere alle, får nødvendigvis konsekvenser hvor sikre vi er på resultatene
våre.
I denne episoden av statistikk-podkasten Nakne Tall
snakker statistiker Jo Røislien med samfunnsviter og valgforsker Johannes Bergh
om det å plukke ut et utvalg fra den store helheten av det vi vil studere,
usikkerheten som det medfører og hvordan denne bør kommuniseres.
Om Nakne Tall
Nakne Tall er
en podkast om statistikk. Hvordan kan man bruke tall til å forstå hvordan
verden henger sammen? Statistiker Jo Røislien inviterer kjente forskere og
formidlere til samtaler med utgangspunkt i sentrale statistiske begreper og
fenomener.
Podkasten
består av ni episoder, og ligger gratis tilgjengelig på Spotify, Apple Podcasts
og andre platformer. Nakne Tall er utviklet av Jo Røislien og
produksjonsselskapet Teddy, og produsert av Universitetet i Stavanger.
Populasjoner og utvalg
Et utvalg er noen, mens populasjonen er alt og alle du vil
studere, om det er mennesker, tabletter, fisk i havet eller lønnsutbetalinger.
Og for at et utvalg skal kunne si noe om alle, så må utvalget være så likt hele
populasjonen som mulig. Utvalget må være representativt for den helheten det er
ment å skulle si noe om.
– Det å få tak i et representativt utvalg er overraskende
vanskelig, sier statistiker Jan Terje Kvaløy i podcastens faste ekspertpanel.
At utvalget er stort hjelper dessverre ingenting. Et utvalg
på to millioner kan være dårligere enn et utvalg på tusen, dersom det siste er
mer representativt for helheten.
Det at vi ikke har studert alle, gir også en usikkerhet i
tallsvarene våre, og denne usikkerheten må vi rapportere så sannferdig som
mulig. Heller enn å bare presentere ett tall som svar på undersøkelsen, regnet
ut fra akkurat det utvalget vi tilfeldigvis hadde, vil forskere derfor ofte
helst rapportere et intervall det er sannsynlig at den sanne tallverdien
befinner seg innenfor.