Lager Wikipedia for risgener

Kinesiske forskere håper å få orden på over 66 000 gener.

Publisert
Forskergruppen ved The Zhang Lab. (Foto: Privat)
Forskergruppen ved The Zhang Lab. (Foto: Privat)

- Er du klar til å grave ut skatten fra ATGCAATGGC…, spør professor Zhang Zhang humoristisk på hjemmesiden sin.

Forskergruppen hans har gått løs på en enorm oppgave: å systematisere all kjent kunnskap om genene til risplanten.

Professor Kjetill Sigurd Jakobsen ved Universitetet i Oslo arbeider med lignende ting her hjemme. Sammen med kolleger og studenter ved Biologisk institutt holder han blant annet på med å kartlegge genene til viktige norske matvarer som torsk og hvete.

Han er enig i at kartlegging av risgener er en skikkelig skattejakt:

- Ris er verdens viktigste matvare, sier Jakobsen. Kunnskap om gener kan hjelpe oss til å avle frem robuste rissorter som ikke må sprøytes så mye og som kan dyrkes under varierende forhold. Dette kan ha stor betydning for verdens matforsyning.

Innholdsfortegnelsen er klar

Det å få oversikt over genmateriale er ikke gjort i en håndvending. Først må man få skaffe oversikt over hvilke gener som finnes og hvordan disse er organisert. Det kalles for gensekvensiering og kan sammenlignes med å lage innholdsfortegnelsen til et stort leksikon.

- Dette er en lang og møysommelig oppgave som tar flere år, forteller Jakobsen.
Akkurat når det gjelder ris har vi imidlertid nokså god oversikt i dag:

- Risplanten var den første kornsorten som var kartlagt på denne måten. Allerede i 2005 hadde man en komplett katalog over de vanligste sortene, forteller Jakobsen.

Katalogen fra 2005 inneholdt over 37 000 gener. Etter hvert som flere rissorter har kommet med, har dette tallet steget til over 66 000.

Ris-leksikon

Men sekvenseringen er bare begynnelsen. Når den er gjennomført, gjenstår et atskillig mer omfattende arbeid, nemlig å skrive selve leksikonet. I korte trekk går dette ut på å skrive én avansert fagartikkel for hvert gen, altså over 66 000 artikler til sammen.

Det kan ikke gjøres av hvem som helst forteller Jakobsen:

Professor Kjetill Sigurd Jakobsen studerer torskegener.. (Foto: UiO)
Professor Kjetill Sigurd Jakobsen studerer torskegener.. (Foto: UiO)

- Det er krevende arbeid som må utføres av spesialister. Det krever solid fagkunnskap og god oversikt over forskningsfeltet.

Artiklene må også vedlikeholdes. Det foregår intens forskningsvirksomhet om risplanten over hele verden. Det finnes allerede over 40 000 publikasjoner og det kommer nye hver dag. Det å pleie kunnskap på denne måten kalles for gene curation, eller genkuratering.

Selv om alle er enige om at arbeidet er svært viktig, blir det avsatt alt for lite ressurser til dette, og det trengs mange flere eksperter til å håndtere denne enorme informasjonsmengden, skriver Zhang:

- For å si det enkelt: selv om databaser, kuratert av eksperter, har vært viktige for vitenskapelig forskning, så strever de med overfloden av informasjon.

Derfor opprettet de RiceWiki - et digitalt leksikon som bruker samme oppsett som Wikipedia og er gratis tilgjengelig for alle. Men i motsetning til Wikipedia, kan ikke alle redigere innholdet uten videre: man må igjennom en liten sjekk for å få lov til det.

Automatisk gullgraving

Heldigvis var de ikke helt på bar bakke når de skulle fylle leksikonet med innhold. Det første de gjorde var å grave ut informasjon fra lignende databaser andre steder i verden som også er fritt tilgjengelig for alle:

- Selv om noen holder ting hemmelig, er det stort sett et godt samarbeid rundt i verden, sier Jakobsen. De fleste innser at vi må samarbeide for å oppnå resultater.

Professor Zhang Zhang. (Foto: Beijing Institute of Genomics)
Professor Zhang Zhang. (Foto: Beijing Institute of Genomics)

Fordi informasjon er beskrevet på en standardisert måte, kan man lage dataprogram som graver frem gullet i disse databasene og putter det inn et annet sted. Slike teknikker blir stadig mer vanlig innenfor dette området. Forskere jobber også med å utvikle teknikker for gullgraving i helt vanlige forskningspublikasjoner.

- Biologi handler i stadig større grad om informatikk. I tillegg til å jobbe med strukturert informasjon, eksperimenterer vi også med å hente informasjon fra vanlig tekst ved hjelp av teknikker fra datalingvistikken, sier Jakobsen.

Automatisk belønning av forfattere

I tillegg til automatisk gullgraving håper den kinesiske forskergruppen at fagfolk selv skal oppdatere artiklene i RiceWiki etterhvert som de produserer forskningsresultater.
Spørsmålet er hvordan man skal motivere folk til å gjøre denne møysomme jobben. Akademikere og forskere får vanligvis lite igjen for denne typen arbeid.

- Det er alltids noen som syns dette er morsomt og ikke er så opptatt av karriere og anerkjennelse. Men det er et problem at denne typen arbeid ikke gir uttelling i akademiske miljø, skriver Zhang.

Jakobsen kjenner seg igjen denne beskrivelsen, men legger til at det å ta seg tid til genkuratering også kan være svært prestisjefylt.

- Vi publiserte en artikkel om torskens immunsystem i tidsskriftet Nature. Da hadde vi 42 medforfattere som hadde gjort mye slikt arbeid, forteller han.

For å bøte på manglende anerkjennelse har de kinesiske forskerne laget en mekanisme som de kaller for Author Reward. Den måler hvor mye tekst hver forfatter bidrar med og hvor lang tid det tar før bidragene deres eventuelt blir rettet av andre.

Selv om det ikke alltid slår rettferdig ut, vil det gi en indikasjon på hvor mye innhold en forfatter har bidratt med og hvor høy kvalitet dette har. Dermed får forfatterne en synlig anerkjennelse som de kan vise til på CV-en sin.

Obligatorisk del av publiseringsprosessen

Et tredje tiltak som virkelig kan gi fortgang i kartleggingen, er å gjøre genkuratering til en obligatorisk oppgave som man publiserer i vitenskapelige tidsskrift:

- En slik ordning er allerede innført i Journal of Plant Physiology, skriver Zhang.

I dette tilfellet handler det om vårskrinneblom, plantenes bananflue. Denne planten er spesielt viktig fordi den reproduserer seg raskt og har et genmateriale som det er lett å få oversikt over. Dermed er den spesielt godt egnet for genforskning.

- Forskere som publiserer artikler om denne planten i Journal of Plant Physiology er samtidig forpliktet til å innarbeide resultatene sine i det internasjonale genleksikonet for vårskrinneblom, skriver Zhang.

Ønsker mekanismene velkommen på Wikipedia

Harald Groven er ansatt ved Senter for IKT i utdanningen og har blant annet ansvar for utvikling og oppstart av nye nettjenester på utdanning.no. Han er også vararepresentant i styret for Wikimedia Norge.

- Vi har akkurat de samme problemene som disse forskerne, forteller han. Vi trenger flere eksperter for å øke kvaliteten, men opplever at dette blir ikke prioritert i fagmiljøene.

Harald Groven ved Senter for IKT i utdanningen. Foto: Erlend Bjørtvedt
Harald Groven ved Senter for IKT i utdanningen. Foto: Erlend Bjørtvedt

Dette skyldes blant annet måten norske universitet og høgskoler er finansiert på, mener Groven:

- I dag får universitet og høgskoler betalt for å drive undervisning og forskning. Hvis de i tillegg hadde få betalt for formidling så ville vi hatt helt andre muligheter til å heve kvaliteten.

De tekniske løsningene finnes allerede:

- Vi har gode teknikker for å gi forfattere synlig anerkjennelse på Wikipedia, også når de har skrevet artikler sammen med mange andre. Vi tror imidlertid at det vil ha begrenset betydning hvis ikke det ikke gir annen uttelling enn symbolsk heder og ære. Derfor har vi ventet med dette foreløpig, sier Groven.

- Undervurdert kanal for kunnskapsformidling

Professor Zhang trenger hjelp med å kartlegge risgener. De fleste nordmenn trenger samme typen hjelp for å møte store for små utfordringer i hverdagen. Groven har en klar oppfordring til alle som arbeider med undervisning og forskning i Norge:

- Wikipedia er Norges mest undervurderte kanal for kunnskapsformidling. Nordmenn står for 133 millioner oppslag hver måned i ulike leksika rundt i verden. 61 millioner av dem er i norsk Wikipedia og 6 millioner i Store norske leksikon.

- Vi må støtte opp om begge disse kunnskapskildene slik at folk får informasjon med høy kvalitet når det er noe de lurer på.

Referanser:

Z. Zhang et. al.: RiceWiki: a wiki-based database for community curation of rice genes. Nucleic Acids Research 2013.

L. Dai et. al.: Author Reward: increasing community curation in biological knowledge wikis through automated authorship quantification. Bioinformatics 2013.