Denne artikkelen er produsert og finansiert av Universitetet i Oslo - les mer.

Maskinlæring kan gi helsepersonell og forskere masse informasjon om helse og sykdom.

Immunforsvaret har skjulte mønstre om sykdom og infeksjoner

Forskere bruker maskinlæring for å hente ut informasjon som immunforsvaret har lagret gjennom livet.

Gjennom livet utvikler immunforsvaret seg. Det lagrer informasjon om alle sykdommene og infeksjonene du har eller har hatt. Dette kalles det ervervede immunforsvaret.

Informasjonen blir lagret som komplekse mønstre utenpå immuncellene.

Vi kan tenke på mønstrene som immunforsvarets hukommelse. De er bruksanvisninger som forteller immunforsvaret hvordan det skal angripe ulike infeksjoner og sykdommer.

Frem til i dag har ingen visst nøyaktig hvordan mønstrene ser ut. Potensialet for hva de kan gi oss av kunnskap om immunforsvaret, og om hvordan vi kan bruke denne til å utvikle nye metoder for diagnostikk og behandling, er enormt. Så hvordan kan forskerne finne mønstrene?

Dataprogram leser mønstrene

Maskinlæring er en form for kunstig intelligens i en datamaskin. Forskere tar dette i bruk for å oppdage de hittil skjulte mønstrene.

Forskerne Victor Greiff og Geir Kjetil Sandve fra Universitetet i Oslo har sammen med doktorgradsstudentene Milena Pavlović og Lonneke Scheffer utviklet programvaren ImmuneML.

– Ved hjelp av maskinlæring kan vi finne mønstrene, som kan gi oss masse informasjon om helse og sykdom, uten at vi i utgangspunktet vet hvordan de ser ut eller hva som kjennetegner dem. Det er det som er så unikt og spennende med maskinlæring, sier Greiff.

Mønstre viser om du syk eller frisk

Mønstrene som immunforsvaret har lagret, viser alt av både nåværende eller tidligere sykdommer og infeksjoner.

Men hvilke mønstre tilhører de ulike sykdommer og infeksjoner? Det forsøker forskerne nå å finne ut. Svarene kan gi ny kunnskap om det ervervede immunforsvaret. Kanskje blir det også enklere å stille diagnoser og utvikle nye behandlinger.

– Klarer vi å finne mønstrene, så kan vi kanskje stille diagnose for en rekke sykdommer ved hjelp av bare én enkelt blodprøve. Ved å analysere blodprøven ved hjelp av maskinlæring kan vi finne mønstrene som pasientens immunsystem har lagret, forteller Greiff.

Målet er å finne mønstrene til tusenvis av sykdommer

Greiff og Sandve samarbeider med forskere og klinikere innenfor ulike medisinske fagfelt. For tiden samarbeider de med forskere ved UiO og ved Universitet i Florida for å finne mønstrene til cøliaki og type I diabetes.

– Den virkelige verdien vil utfolde seg når vi har lært mønsteret for en lang rekke sykdommer. Da kan du i prinsippet diagnostisere tusenvis av sykdommer fra én blodprøve. Det er målet, sier Sandve.

Maskinlæring og covid-19

Å finne for eksempel mønsteret til covid-19 blir litt som å lete etter ett bestemt snøfnugg blant millioner av andre snøfnugg. Hvordan ser snøfnugget ut?

Med maskinlæring kan forskerne la datamaskinen finne mønstrene til en person som har covid-19. Slik lærer datamaskinen å gjenkjenne mønsteret til sykdommen.

Det samme kan forskerne gjøre for andre sykdommer og for friske personer.

– Det er sånn maskinlæring fungerer. Vi må først lære datamaskinen hva som er hva. Det kan vi gjøre ved å la den finne mønstrene til en person som vi vet at er frisk, og til en person personer som vi vet har en bestemt sykdom, forklarer Greiff.

Datamaskinen kan ved å analysere blodprøver fortelle om personen har en bestemt sykdom eller er frisk basert på mønstrene som den har lært å kjenne igjen.

Programvare blir delt med andre forskere

I utgangspunktet skulle Sandve og Greiff utvikle en programvare for maskinlæring innen egen forskning. Men de innså fort at behovet for en felles programvare innenfor feltet var stort.

– Jeg følte det litt som at vi måtte grave ut byggeplassen for hånd gang på gang, før vi kunne gå i gang med selve byggingen, altså analysene, forteller Sandve.

Greiff forteller at dette har ført til at studiene som har brukt maskinlæring innenfor immunologien tidligere, har vært lite standardiserte og derfor vanskelige å kvalitetssjekke og replisere. Det betyr at andre forskere ikke kunne gjennomføre samme studie på samme måte for å se om hun eller han får samme resultat.

– Doktorgradsstudent Milena Pavlović fikk i oppdrag å utvikle programvaren som ville gjøre det mulig for henne å gjennomføre sine egne, fremtidige studier på en mer effektiv og god måte enn hva som var vanlig i dette feltet, forteller Sandve.

Da Sandve og Greiff oppdaget hvor god plattformen ble, så ønsket de å dele den med andre. Doktorgradsstudent Lonneke Scheffer ble med på arbeidet, og i dag, godt over et år senere, er programvaren klar til bruk for dem og andre forskere på feltet.

– ImmuneML gjør det mulig å jobbe mer enhetlig. Vi kan nå sammenligne ulike studier og vurdere verdien av ulike tilnærminger.

Referanse:

Milena Pavlović, Geir Kjetil Sandve mfl.: The immuneML ecosystem for machine learning analysis of adaptive immune receptor repertoires. Nature Machine Intelligence, 2021. (Sammendrag). Doi.org/10.1038/s42256-021-00413-z

ImmuneML

Førsteamanuensis Victor Greiff og professor Geir Kjetil Sandve har samarbeidet og jobbet med utviklingen av ImmuneML siden 2018. Laboratoriene deres jobber nå tverrfaglig og samarbeider om de aller fleste forskningsprosjektene.

ImmuneML skal kunne brukes av forskere med ulik erfaring og kompetanse innenfor bioinformatikk og maskinlæring.

De har også en egen YouTube-kanal med forklarende videoer.

USIT ved UiO og Elixir Norge har bidratt til utviklingen av ImmuneML-programvaren.

Powered by Labrador CMS