Vi vet mer og mer om hva enkelte gener betyr for helsen vår, men vet vi nok til å kunne sette diagnoser? Nei, mener biostatistiker Claus Thorn Ekstrøm. (Illustrasjon: SVshot / Shutterstock / NTB scanpix)

Professor advarer: For mye informasjon kan føre til overdiagnostisering

Mer helsedata kan gi bedre behandling. Men utviklingen kan også øke mengden av feildiagnoser, advarer statistiker.

I dag er det vanskelig å foreta seg noe som ikke blir registrert. Telefonen forteller hvor du befinner deg. Nettbanken avslører hva du bruker penger på, og snart har du også adgang til din genetiske profil.

Det er mye som er bra med det. GPS-en i telefonen forteller deg hvor du skal, nettbanken gir deg et overblikk over økonomien, og den genetiske profilen kan hjelpe legen med å finne ut hva som er galt med deg når du er syk.

Men den store mengden data gjør også ting vanskeligere, forteller Claus Thorn Ekstrøm, som er professor ved biostatistisk avdeling, institutt for medisin ved Københavns Universitet.

– Mer data gjør det mulig å se flere mønstre. Problemet er støy, og det er fortsatt vanskelig å finne ut hva de virkelige sammenhengene er. Derfor kan pasienter bli behandlet på feil grunnlag.

Han frykter at når vi oppdager egenskaper ved bestemte gener uten å forstå den større sammenhengen, kan vi sykeliggjøre mennesker unødvendig.

– Derfor er det veldig viktig at vi ser på en stor mengde samlet evidens før vi begynner å behandle folk ut fra dataene, sier han.

Hva er Big Data?

  • Big Data har blitt en populær betegnelse for veldig store datasett.
  • Typisk defineres big data også som datamengder som ikke bare er store, men også varierte. Altså at de stammer fra flere ulike kilder og oppdateres raskt – de såkalte tre v-ene: Volum, Variety og Velocity.
  • I takt med at verden digitaliseres, lagres stadig mer informasjon om folk, og den informasjonen kan blant annet brukes til å lete etter sykdom.
  • I denne artikkelen fokuserer vi særlig på informasjon om livsstil og genetikk.

Kilde: Claus Thorn Ekstrøm

Claus Thorn Ekstrøm holdt nylig et innlegg ved konferansen «Preventing overdiagnosis 2018» i København.

Stort potensial – store fallgruver

De store informasjonsmengdene åpner en masse dører.

Med informasjon om livsstil og genetikk vil en lege, en statistiker eller til og med en datamaskin kunne finne mønstre som avslører risikoen for blant annet diabetes, hjerte/kar-sykdommer og kreft.

Ifølge Ekstrøm risikerer vi å gjøre mer skade enn nytte siden vi fortsatt ikke forstår sammenhengene i de store datasettene.

– Det foregår en debatt om det er greit å samle inn disse dataene. Men jeg savner fokus på hvordan vi kan utvikle metoder til å analysere data. Det er ikke sikkert dagens verktøy er gode nok, forteller Ekstrøm.

Vi kan fortsatt ikke være sikre på sammenhenger

Sammenhenger kan være vanskelige å forstå hvis man ikke kjenner mekanismene bak.

Et klassisk eksempel er sammenhengen mellom salget av is og antallet haiangrep. Ser man bare på de to variablene, ser det ut til at folk kjøper mer is når det er flere haiangrep – eller omvendt, men i virkeligheten er det en tredje faktor som har betydning: nemlig årstiden.

I store mengder data kan det finnes mange sammenhenger, men det er vanskelig å se hva som påvirker hva. De kalles korrelasjoner.

En korrelasjon kan for eksempel være at mange personer som har økt blodtrykk, har et bestemt gen.

– Vi kan finne masse mønstre i forholdet mellom livsstil, gener og risikoen for sykdom. Men vi kan kanskje ikke forklare hvorfor mønstrene er der, og det kan føre til overdiagnostisering, advarer Ekstrøm.

Derfor etterlyser han mer forskning på å avdekke årsakssammenhenger.

En årsakssammenheng kan være når en pasient har en mutasjon i et gen, så øker blodtrykket gjennom en prosess forskerne kan forklare.

Datamaskiner liker korrelasjoner

Datamaskiner har vist seg å være veldig flinke til å forutsi sykdommer hos pasienter.

For eksempel har forskere ved Oxford Universitet utvikle et system for kunstig intelligens som kan diagnostisere hjertefeil med større presisjon enn hjertelegene.

Når et datasystem skal vurdere en persons risiko for en gitt sykdom, bruker den en rekke indikatorer, som enten peker på et ja eller et nei.

Her kan korrelasjoner være gode indikatorer, selv om de kanskje ikke relaterer seg rett til sykdommen.

I 2016 lærte tre studenter en datamaskin å se forskjell på hunder og ulver. Men da de undersøkte hva som lå til grunn for vurderingen, fant de ut at den hovedsakelig så etter om det var snø på bildet.

Selv om et slikt system er nøyaktig, kan det ikke nødvendigvis svare på hvorfor bildet forestiller en hund eller en ulv.

På samme måte kan en datamaskin som forutsier en pasients risiko, ikke nødvendigvis forklare valget. Og derfor kan resultatet bli feildiagnoser, forteller Ekstrøm.

– Store datasett gjør det lettere å finne mange mønstre, men det gjør det ikke nødvendigvis lettere å finne fram til hvilken mekanisme som gjør pasienten syk, og hvis vi ikke kan det, så kan vi kanskje heller ikke utvikle den riktige behandlingen, sier han.

Datamaskiner er eksperter på å oppdage mønstre – men ikke like flinke i å vurdere sammenhengen. Et system for kunstig intelligens lærte i 2016 å se forskjell på ulver og hunder. På en måte. Det viste seg at den mente at det var snakk om en ulv når det var snø på bildet. (Foto: Geoffrey Kuchera / Shutterstock / NTB scanpix)

Screening øker risiko for overdiagnostisering

Slik kan Big Data føre til overdiagnostisering

  • Å overdiagnostisere er å gi en sykdomsdiagnose selv om symptomene ikke er tilstrekkelige.
  • Hvis det finnes genvarianter som er forbundet med økt risiko for sykdom hos en pasient, og man ikke er bevisst på de større sammenhengene, risikerer man ifølge Claus Thorn Ekstrøm å overdiagnostisere.
  • Mens de enkelte variantene kan tyde på at pasientens risiko for sykdom er store, kan det være andre genmutasjoner som beskytter og som man ikke kjenner enda.
  • Dessuten nevner Eriksen at en økt risiko ikke nødvendigvis innebærer at sykdommen utvikles.
  • Derfor kan en større mengde data bidra til overdiagnostisering.

At vi fortsatt ikke har den nødvendige kunnskapen, gjør at vi forskere må fokusere på sammenhengen mellom gener, livsstil og nye analysemetoder til store datasett, mener Ekstrøm.

Men han er bekymret for at sammenhengene blir bruk for tidlig.

Dessuten frykter han at store mengder data vil forsterke tendensen til å bruke screening.

– Ved screening er det fare for å overdiagnostisere. Hvis vi begynner å screene hele befolkningen for alt mulig, vil tallene bli store, sier han.

Hvis vi for eksempel sier at faren for feildiagnose er 5 prosent, og pasienten blir utsatt for 20 ulike screeninger, vil risikoen for at pasienten blir overdiagnostisert minst én gang, stige til hele 64 prosent.

– Og 20 screeninger kan være lite hvis man tenker på hvor mange sykdommer man vil kunne sjekke for innen nærmeste framtid, sier Ekstrøm.

Professor: Big Data kan også hindre overdiagnostisering

Torben Falck Ørntoft, som er overlege og professor i molekylærbiologi og genetikk ved Aarhus universitet i Danmark, er både enig og uenig.

– Det er helt riktig at vi ikke vet nok om sammenhengene til å kunne bruke big data til å sette diagnoser. Det vil vi ikke gjøre før vi har bygget opp en solid evidens, sier han.

Men han tror ikke big data nødvendigvis vil føre til overdiagnostisering. Faktisk kan det i visse tilfeller hindre det.

– Det er for eksempel en stor debatt om ryggoperasjoner for tiden. Mange av pasientene har ryggsmerter selv etter operasjon, og det viser seg at en psykologisk test kan filtrere ut de som ikke vil ha nytte av det, sier han.

Ørntoft tror mer data kan føre til færre behandlinger.

Vi skal ikke screene alle

Torben Falck Ørntoft er enig i at vi ikke bør ha mer screening. Han mener i stedet at vi skal ha bedre screening. Og her gir flere data nye muligheter.

Han nevner blant annet en stor engelsk studie nylig utgitt i tidsskriftet Nature Genetics, der forskerne har brukt blodprøver fra 400 000 britiske blodgivere til å finne fram til en rekke genmutasjoner som øker risikoen for bestemte sykdommer.

8 prosent av blodgiverne hadde en genmutasjon som tredoblet risikoen for koronararteriesykdom.

– Det er ganske få som har disse mutasjonene. De bør vi holde øye med. Men hele befolkningen bør ikke screenes for alt mulig, sier Ørntoft.

– Denne gruppen vil ha godt av å høre de må trene, stumpe røyken og så videre, sier han.

Professor: Bare informasjon hvis det er mulig å gjøre noe

Ifølge Torben Falck Ørntoft er det mulig å finne fram til høyrisikogrupper allerede før man begynner å screene.

Men hva med de personene som har en litt høyere risiko enn andre – eller personer som har en høy risiko for en sykdom det ikke er mulig å behandle?

For Ørntoft er svaret klart:

– Man forteller ikke folk at de har en risiko med mindre man har et tilbud som kan hjelpe dem, sier han.

Få genprofilen på nettet – og bli bekymret

Det danske helsesystemet bruker altså ikke big data enda, og Torben Falck Ørntoft er overbevist om at det først skjer når evidensen er på plass.

Claus Thorn Ekstrøm nevner imidlertid at private bedrifter allerede er i gang.

23andMe.com kan du for eksempel kjøpe informasjon om genene sine. Du sender en spyttprøve i posten, så analyseres den genetiske profilen. Dermed får man en oversikt over risikoene for ulike sykdommer.

Slik kan Big Data hindre overdiagnostisering

  • Er man bevisst på de større sammenhengene, kan big data føre til mer presis diagnostisering.
  • Hvis vi kjenner både genvariantene som øker og senker risikoen, kan man finne fram til personer med større risiko og screene dem.
  • Det innebærer at det antallet mennesker som deltar i screeninger, kan bli mindre, og det senker risikoen for feildiagnoser.

Kilde: Torben Falck Ørntoft

– Denne samlingen av varianter med ulike risikoer – hva betyr de for en pasient? Hvis du ikke kan gjøre noe med det, vil du så virkelig vite det? spør Ekstrøm.

Dessuten forteller Torben Falck Ørntoft at det ikke er vitenskapelig belegg for alle påstandene på hjemmesiden.

– Det er juks og bedrag. Man kan ikke se slike generelle risikoer. Det er en masse variasjoner og usikkerheter som de ikke tar høyde for, sier han.

Visse genvarianter øker risikoen for noen sykdommer, men samme person kan også ha andre varianter som beskytter mot samme sykdom – og disse kjenner vi fortsatt ikke, forteller Ørntoft.

– En ting er hvor mye en bestemt varianter øker risikoen for en sykdom, men noe annet er penetransen – altså hvor mange som faktisk blir syke. Her er det en masse beskyttende forhold vi ikke kjenner, sier Ørntoft.

Han frykter imidlertid ikke at det kommer flere private bedrifter som 23andMe.

– Folk kan jo oppføre seg så tullete som de vil. Men det er ikke noe nytt. De har vært her i 15 år.

Referanse:

A.V. Khera mfl: «Genome-wide polygenic scores for common diseases identify individuals with risk equivalent to monogenic mutations», Nature Genetics (2018), DOI: 10.1038/s41588-018-0183-z Sammendrag

© Videnskab.dk. Oversatt av Lars Nygaard for forskning.no.

Powered by Labrador CMS