The Stanford Prison Experiment er en av historiens mest kjente psykologistudier.

Men det har vist seg at resultatene fra både denne og mange andre studier innen psykologien ikke lar seg gjenskape.

www.prisonexp.org
Stanford prison experiment.

Forskningen i dette faget har alvorlige problemer, mener forskere.

Noe er galt i
forskningen på psykologi

Nesten alle studier innen psykologi bekrefter det forskeren trodde. Bør det få alarmene til å ringe?

Enhver forsker drømmer nok om det:

Du har en hypotese – en djerv antagelse om hvordan noe henger sammen – som du tester i en vitenskapelig studie.

Og når resultatene kommer, innfrir de forhåpningene. Det stemmer! Resultatene bekrefter at du hadde rett i dine antagelser.

En vitenskapelig seier.

Eller er det det?

Må bli lei av å vinne!

I 2022 kom psykologiprofessor Gerald Haeffel med en innstendig oppfordring til sine kollegaer verden over:

Nå må vi forskere innen psykologi bli lei av å vinne hver gang! 

Haeffel refererte blant annet til en ny undersøkelse som viste at 96 prosent av studiene innen psykologi konkluderte med at hypotesen stemte. 

Det er ikke bra. 

For når forskere nesten alltid har rett, er det ikke et tegn på at de er geniale. Det er i stedet et urovekkende hint om at noe er galt med studiene.

Bekymringsverdig studie

Undersøkelsen Haeffel viste til, er slett ikke første tegn til problemer innen forskningen på psykologi.

Tidlig på 2010-tallet hadde flere forskere begynt å stille spørsmål ved kvaliteten på mange undersøkelser.

Og i 2015 ble en brannfakkel av en studie publisert i det vitenskapelige tidsskriftet Science.  

Forskeren Brian Nosek og en stor gruppe kollegaer hadde satt opp en diger test: 

De hadde plukket ut 100 tilfeldige psykologistudier nylig publisert i tre prestisjetunge vitenskapelige tidsskrifter. Så hadde forskerne rett og slett gjort studiene på nytt, for å se om de fikk samme resultat

Det gjorde de ikke.

Replikasjonskrise

Hva er psykoterapi?

Psykoterapi er å bruke psykologiske metoder til å behandle psykiske lidelser og problemer. Behandlingen går ut på at terapeuten og pasienten snakker sammen. Målet er mentale forandringer som gir økt livskvalitet eller bedret psykisk helse.

97 prosent av de originale studiene hadde bekreftet forskernes hypoteser. Da nøyaktig de samme undersøkelsene ble gjort igjen, var det bare 37 prosent som bekreftet hypotesen.

Og selv i disse studiene var resultatene ofte langt svakere enn i de originale studiene.

I kjølvannet av denne og andre undersøkelser ble flere store sannheter innen psykologien trukket i tvil.

En betydelig andel av det jeg lærte på grunnfag i psykologi i 2001, har siden vist seg å ikke holde vann.

Joar Øveraas Halvorsen, psykolog og forsker

Problemene på feltet blir ofte omtalt som replikasjonskrisen. Mange har pekt spesielt på problemene innen sosialpsykologien, som forsøker å forklare hvordan vi mennesker påvirker hverandre mentalt. Men også andre områder, som klinisk psykologi, ser ut til å være rammet. 

Henrik Berg er professor i vitenskapsteori ved Universitetet i Bergen.

Den kjente statistikeren og vitenskapskritikeren John Ioannidis skrev i 2022 at det meste av dokumentasjonen vi har på psykoterapi, er svært fordreid:

– De fleste former for psykoterapi gjør trolig ingen eller liten nytte, selv når publisert litteratur antyder at de er svært effektive, skrev han i Epidemiology and Psychiatric Sciences

– Usunne forskningspraksiser

Henrik Berg er utdannet i både psykologi og filosofi og jobber som professor i vitenskapsteori ved Universitetet i Bergen. Han bekrefter at forskningen på psykologi står overfor utfordringer.

Saken er komplisert. Psykologiske mekanismer kan være ekstremt komplekse, og det er utfordrende å sette opp gode studier uten å forenkle fenomenene i hjel. 

Men det er ingen tvil om at en del av forskningen på feltet har vært av lav kvalitet, mener Berg.

– De siste ti årene har man avdekket en del ganske usunne forskningspraksiser innen helsefag og psykologi, sier han til forskning.no.

Alle kunne kanskje ikke bli onde likevel

Joar Øveraas Halvorsen er psykologspesialist og førsteamanuensis ved NTNU. Også han mener mange av studiene innen psykologi er for dårlige. Det fører igjen til at mye av kunnskapen på feltet blir usikker.

– Det er veldig få ting vi kan påstå med stor grad av sikkerhet i fagfeltet mitt. En betydelig andel av det jeg lærte på grunnfag i psykologi i 2001, har siden vist seg å ikke holde vann, sier han.

Det var for eksempel lenge kjent at nesten alle mennesker kan bli onde når de bare får sjansen.

Dette ble tydelig vist i de berømte fengselseksperimentene til forskeren Philip Zimbardo og kollegaene hans ved Stanford i 1971.

Flere studenter ble stengt inne i en kjeller og fikk roller som fanger og fangevoktere.

Stanford prison experiment.

Studentene som skulle være fangevoktere, begynte snart å behandle studentfangene umenneskelig.

Alle så ut til å bli onde, bare de fikk sjansen.

Men senere viste det seg at forskerne hadde gått langt i å instruere vokterne i hvordan de skulle oppføre seg.

Joar Øveraas Halvorsen er psykologspesialist og førsteamanuensis ved NTNU.

– Jeg tenker at vi har vært i – og fremdeles er i – en replikasjonskrise i psykologifaget, sier Halvorsen.

Forskerens egen metode virker alltid best

Jan Ivar Røssberg er professor i psykiatri ved Universitetet i Oslo og overlege i psykiatri ved Oslo universitetssykehus. Han har selv gjort mange studier på psykoterapi og kjenner forskningen på feltet godt.

Også han bekrefter problemene.

– Du skal lete lenge etter studier der ikke det forskeren selv tror på, vinner igjennom. Jeg vet bare om én studie der forskerens egen metode kom ut som minst effektiv, sier Røssberg.

Dette er faktisk så uvanlig at denne ene studien ble kjent i fagkretsene – nettopp fordi den ikke viste at forskerens favorittmetode var best. Denne studien skal vi komme tilbake til.

Men først:

Hvorfor er det slik? Hvorfor finner forskerne til stadighet ut at hypotesene deres stemmer, samtidig som under halvparten av resultatene blir bekreftet hvis den samme studien gjøres på nytt?

Mange studier innen psykologi er satt opp slik at det er veldig sannsynlig at de viser at terapien virker godt, mener Jan Ivar Røssberg, professor i psykiatri ved Universitetet i Oslo og overlege i psykiatri ved Oslo universitetssykehus.

Problem i forskningskulturen

La det ikke være tvil: Trøbbel med kvaliteten i forskningen rammer også andre fagfelt. Studier har for eksempel vist tegn på replikasjonskrise både innen kreftforskning og økonomi

Men Gerald Haeffel mener psykologien har et spesielt problem i forskningskulturen sin.

Han mener psykologien rett og slett har sluttet å bruke vitenskapen til å undersøke årsaker og virkninger. 

Hypotesetesting

Det finnes mange måter å samle kunnskap på, for eksempel gjennom dybdeintervjuer med pasienter. Her er Haeffel imidlertid spesielt opptatt av den delen av forskningen som driver med hypotesetesting.

Innen mange fagfelt, som fysikk, biologi og medisin, skjer kunnskapsjakt typisk ved å sette opp hypoteser – altså modeller for hvordan man tror ting henger sammen. 

Så gjør forskerne eksperimenter eller andre undersøkelser for å teste om disse modellene faktisk stemmer med virkeligheten.

Hele poenget med disse testene er at de også skal kunne vise at hypotesene ikke stemmer. Slik falsifisering er et kjennetegn ved vitenskapen. 

Mener psykologien har sluttet å teste hypoteser

Ut fra resultatene, vil hypotesene finslipes, forandres eller forkastes. Ny kunnskap bygger på tidligere funn, og ulike hypoteser konkurrerer mot hverandre. Etter hvert vil de modellene som best forklarer virkeligheten, vinne fram.

På denne måten er det mulig å bygge stadig mer presise teorier om hvordan fenomener i verden virker. Innen biologien har for eksempel evolusjonsteorien vokst fram.

Men veldig mye av forskningen innen psykologi er ikke slik, skriver Haeffel og fortsetter:

Psykologien har stoppet å bruke denne vitenskapelige metoden slik den skal. 

Om å gjøre å publisere flest mulig positive resultater

I mange tilfeller kan ikke ideene innen psykologi falsifiseres. Altså, det er ikke mulig å sette opp tester som kan vise om de er feil. 

I stedet er målet ofte å publisere flest mulig studier som viser at forskernes egne hypoteser stemmer, uavhengig av om dette gir større innsikt eller bedre behandling, skriver Haeffel.

En slik kultur oppfordrer til dårlig forskning, mener han.

Dette trenger slett ikke handle om bevisste forsøk på å manipulere resultatene. Men i virkeligheten kan det likevel bli slik.

Rigget for positivt utfall

Dette kan Røssberg fra UiO bekrefte.

– Mange studier er satt opp slik at de må gi positive resultater. En av verdens beste forskere på depresjon har skrevet en veldig god artikkel om dette, sier han.

Røssberg sikter til en dryppende ironisk artikkel av Pim Cuijpers og Ioana Alina Cristea, publisert i Epidemiology and Psychiatric Sciences i 2016.

Forskerne beskriver hvordan man skal legge opp en vitenskapelig studie som vil vise at terapien din virker selv om den egentlig ikke gjør det. I faktaboksen under ser du oppskriften.

Oppskrift på studie som vil gi gode resultater

  • La studien bli gjennomført av forskere som har mye å vinne på gode resultater for behandlingsformen som testes. Det har en tendens til å påvirke tolkningen av resultatene.
  • Utfør behandlingen i undersøkelsene på en måte som maksimerer håp og forventning hos deltagerne, ikke nødvendigvis slik pasientene vil få terapien i virkeligheten.
  • Ikke kontrollert for placeboeffekten! Sett heller opp forsøket slik at du sammenligner behandlingen med noe pasientene kanskje blir verre av. Slik ser det ut som om behandlingen din har stor effekt.
  • Ha med få deltagere. Da øker sjansen for tilfeldige positive funn, selv når behandlingen egentlig ikke har effekt.
  • Mål mange mulige endringer av behandlingen. Dersom metoden ikke ser ut til å virke på det du skulle undersøke i utgangspunktet, kan det hende det dukker opp noen positive endringer på de andre målene. Og da kan du jo bare fokusere på dem, mens du ikke snakker så mye om det som ikke virket.
  • Og skulle alt likevel ende i negative resultater, kan du jo alltids legge studien i skuffen, i stedet for å offentliggjøre falitten, skriver Cuijpers og Cristea.

Undergraver psykologiens troverdighet

Oppskriften på studier med gode resultater er selvfølgelig satt på spissen.

Men poenget til Cuijpers og Cristea er at mange studier innen psykologi nettopp er designet litt på en slik måte. Punktene representerer ulike dårlige praksiser innen forskningen som til sammen kan gi studier med slående, men lite troverdige resultater.

– Vi vet fra klinisk forskning at studier med lav kvalitet har en tendens til å finne høyere effekt enn dem med god kvalitet, sier Halvorsen fra NTNU.

Han mener dårlig forskning er med på å undergrave troverdigheten til psykologien som vitenskap.

Men her er det også stor uenighet mellom ulike forskere på feltet.

Mange mener at replikasjonskrisen er reell og må tas på alvor. Men det er ikke enighet om hvilke metoder som er gode nok.

Et godt eksempel på dette er diskusjonene rundt bruken av venteliste som kontrollgruppe.

Sammenligning er viktig

Når forskere skal undersøke en type behandling på mennesker, er det viktig å ha noe å sammenligne med. Altså en kontrollgruppe.

En undersøkelse kan for eksempel vise at pasienter som får en viss behandling, blir bedre. Men er det behandlingen som virker?

Pasientene kan også ha blitt bedre av seg selv eller opplevd en generell placeboeffekt.

Det er her kontrollgrupper kommer inn. Ved å sammenligne resultatene i de to gruppene, kan forskerne finne ut om behandlingen i seg selv har en virkning.

Venteliste som kontrollgruppe

I de fleste studier innen psykologien sammenlignes resultatene av behandlingen med pasienter som står på venteliste for den samme behandlingen.

Men slike studier kan ikke vise om deler eller hele effekten bare skyldes placeboeffekten. Dette kan bety at vi får et skjevt bilde av hvor godt behandlingen virker. 

Behandlingsformene vi tilbyr, kan i virkeligheten være langt mindre effektive enn studiene tilsier, skriver Beth Patterson fra McMaster University og hennes kollegaer, etter å ha undersøkt saken i 2016. 

Dette er noe av grunnen til at forskere er så uenige om hvor godt psykoterapi virker. Noen forskere mener ventelistestudiene skal være med i vurdering av hvor godt terapi virker. Da viser oppsummeringer gjerne at behandlingen har stor effekt. 

Andre forskere mener ventelistestudiene må tas ut. Da viser oppsummeringene en mer beskjeden virkning.

(Les mer om utfordringene med ventelistestudier her.)

Sverre Urnes Johnsen er professor og psykologspesialist ved Universitetet i Oslo og Modum Bad.

– Jeg mener ventelistekontroll er å legge lista litt for lavt. Med den kunnskapen vi har i dag, vil jeg anbefale at andre kontrollgrupper brukes, sier Røssberg.

Kan ikke stoppe der

Sverre Urnes Johnson er professor og psykologspesialist ved Universitetet i Oslo og Modum Bad. Han argumentere for bevissthet rundt bruken av ventelister. 

– Venteliste som kontrollgruppe har svakheter, men det avgjørende er at man sammenligner med noe, sier Johnson.

Det viktigste er at forskerne er bevisste på hvordan de bruker og tolker slike studier, mener Johnsen.

– Vi kan ikke stoppe der og hevde at vi har funnet løsningen, sier Johnsen.

– Neste skritt er å sette teorien på spill – å sette opp en større studie der vi sammenligner effekten med de best dokumenterte behandlingsformene på feltet. Altså at aktive behandlingsformer sammenlignes mot hverandre.

Må legge sin egen behandlingsform i potten

Men innen psykologien skjer ikke alltid dette. 

Å teste sin egen metode mot andre behandlingsformer, kan være følsomt og vanskelig for forskerne, som gjerne har sterk tro på sine egne metoder.

– Terapeuter identifiserer seg ofte i stor grad med metodene sine. Det krever tillit til forskerteamene som er involvert å legge sin behandlingsform i potten, sier Johnsen.

For hva om resultatene blir dårligere enn forventet?

Det var akkurat dette som skjedde med den beryktede artikkelen som ikke bekreftet forskerens hypotese.

Sjokkstudie

Stig Bernt Poulsen og Susanne Lunn ved Københavns Universitet ville teste virkningen av sin egen behandlingsform – psykoanalytisk terapi – på pasienter med bulimi.

Denne gangen sammenlignet de ikke med venteliste. I stedet lot de pasientene i kontrollgruppen få behandling med terapiformen kognitiv terapi. De som analyserte dataene, visste ikke hvem som hadde fått hva.

Og resultatene kom som et sjokk.

Abstract,Shopping,Mall,Background

Bare 15 prosent av pasientene som fikk psykoanalyse, hadde sluttet med overspising og oppkast etter to år.

I gruppa som fikk kognitiv terapi, hadde 44 prosent sluttet med det.

Og det til tross for at kontrollgruppa bare hadde fått 20 timer kognitiv terapi over fem måneder, mens de andre hadde fått ukentlige timer med psykoanalyse i to år.

Skuffende resultater er gull verdt

Slike resultater kan fortone seg som katastrofale for forskerne som har satt sin teori på spill. Særlig når de ikke får støtte fra sine kollegaer.

Forskere som publiserer negative funn, kan nok fort bli uglesett av andre innen samme terapiform, sier Røssberg fra UiO.

Men for pasientene er denne typen resultater gull verdt. For nå har vi fått mer kunnskap om hva som virker og hva som ikke virker.

– Det er utrolig viktig for faget at også negative resultater blir publisert, selv om det kan være tøft for forskerne som gjør det, sier Røssberg.

Haeffel påpeker at det nettopp er slike resultater som driver vitenskapen framover.

Svein Magnussen, professor emeritus i psykologi ved Universitetet i Oslo

Han mener uviljen mot negative utfall gjør at psykologifaget stagnerer som vitenskap. 

– Mer elendig forskning hjelper ingen

Flere forskere oppfordrer til mer bevissthet rundt hva som skjer innen forskningen på psykologi.

Svein Magnussen, professor emeritus i psykologi ved Universitetet i Oslo, mener stikkordet er kvalitet.

– Mitt inntrykk er at det hele tiden ropes på mer forskning. Men ingen stiller spørsmålet: Hva med den forskningen som faktisk blir gjennomført hele tiden – er kvaliteten god nok? Stiller vi de riktige spørsmålene?

– Mer elendig forskning hjelper ingen. Jeg tror vi trenger bedre forskning, sier han.

– Det blir bedre

Røssberg mener likevel det er grunn til optimisme.

– Vi henger litt etter. Men forskningen på psykoterapi er bedre i dag enn for bare ti år siden, sier han.

Selv gjør han og kollegaene nettopp randomiserte, kontrollerte studier for å finne ut mer om hvordan ulike typer psykoterapi virker.

Han mener det er viktig å få fram hvor vanskelig dette er.

– Psykoterapistudier vil aldri kunne bli like strenge og optimale som legemiddelstudier, sier han.

I en studie av et legemiddel kan du gi alle den samme pillen. Men i psykoterapien er behandlingen et samspill mellom behandleren og pasienten. Det kan ikke standardiseres på samme måte.

I Røssberg og kollegaenes studier går forskerne gjennom videoopptak av tusenvis av terapitimer for å se hva terapeutene faktisk gjør.

– Jeg tror mange av dem som uttaler seg om hvordan studier i psykoterapi bør gjøres, ikke har prøvd det selv, sier han.

– Det er utrolig vanskelig å gjøre slike studier. Jeg pleier å si at før jeg gjorde en randomisert kontrollert studie av psykoterapi, var jeg også høy og mørk. 

– Etter å ha gjort noen studier, er jeg blitt tjukk og skalla.

———

Denne saken kan du også lese på engelsk på sciencenorway.no

Bilder:

Alle bildene fra det The Stanford Prison Experiment: PrisonExp.org.
Det blå illustrasjonsbildet: Yiucheung/Shutterstock/NTB

Kilder:

Gerald J. Haeffe, Royal Society Open Science, Psychology needs to get tired of winning, juni 2022. 

A. M. Scheel, m. fl., An Excess of Positive Results: Comparing the Standard Psychology Literature With Registered Reports, Advances in Methods and Practices in Psychological Science, April 2021. 

Open Science Collaboration, Psychology: Estimating the reproducibility of psychological science, Science, august 2015. 

J. P. A. Ioannidis, Most psychotherapies do not really work, but those that might work should be assessed in biased studies, Epidemiology and Psychiatric Sciences, oktober 2016. 

B. Patterson, M. H. Boyle, M. Kivlenieks, M. Van Ameringen, The use of waitlists as control conditions in anxiety disorders research, Journal of Psychiatric Research, desemeber 2016. 

J, A, Cunningham, K. Kypri & J. McCambridge, Exploratory randomized controlled trial evaluating the impact of a waiting list control design, BMC Medical Research Methodology, desember 2013. 

T. A. Furukawa, H. Noma, D. M. Caldwell, M. Honyashiki, K. Shinohara, H. Imai, P. Chen, V. Hunot, R. Churchill, Waiting list may be a nocebo condition in psychotherapy trials: a contribution from network meta-analysis, Acta Psychiatrica Scandinavica, September 2014. 

S. Poulsen, S. Lunn, S. I. F. Daniel, S. Folke, B. B. Mathiesen, H. Katznelson, C. G. Fairburn, A randomized controlled trial of psychoanalytic psychotherapy or cognitive-behavioral therapy for bulimia nervosa, The American journal of psychiatry, januar 2014. 

Få med deg ny forskning

MELD DEG PÅ NYHETSBREV

Du kan velge mellom daglig eller ukentlig oppdatering.

Powered by Labrador CMS