Annonse

Denne artikkelen er produsert og finansiert av NILU - les mer.

Mann i hvit frakk jobber på nettbrett
Det finnes spesifikke regler for hvordan forskere siterer andre forskere. Målet er å vise klart og tydelig hva forskningen er bygget på.

Nå kan forskere lenke direkte til data om atmosfæren i vitenskapelige artikler 

– Kunnskapsgrunnlaget blir sikrere når vi kan dokumentere om forskere har brukt samme sett med data i hver sine studier eller om datasettet er nyere eller eldre, sier forsker.

Publisert

En av verdens største databaser for data om målinger av atmosfærens sammensetning heter EBAS. Den driftes av NILU. 

Tidligere har det ikke vært så enkelt å finne ut nøyaktig hvilke datasett som er brukt i ulike vitenskapelige artikler. 

Men nå kan forskere – og andre – lenke til eller sitere ulike data om atmosfæren fra EBAS.  

– Når forskningsdata er sporbare, blir også vitenskapen basert på dem sporbar og mulig å etterprøve. Det er hovedpoenget med å gjøre datasettene lettere å referere til, sier seniorforsker Cathrine Lund Myhre. 

Hun jobber i NILUs atmosfære- og klimaavdeling.

Hva er en vitenskapelig artikkel?

En vitenskapelig artikkel er skrevet av en eller flere forskere eller fageksperter og publiseres i et vitenskapelig tidsskrift. De henvender seg særlig til andre forskere og fageksperter og skal bidra til å videreutvikle kunnskap innenfor fagområdet.

Før artikkelen publiseres, vurderer andre eksperter innenfor faget bidraget kritisk. Det kalles fagfellevurdering. 

Kilde: Store norske leksikon

Siterbare datasett er stadig viktigere

Det Lund Myhre snakker om, kalles som regel sitering. Det betyr at du viser til andres forskning eller resultater når du skriver om din egen forskning. 

Det finnes spesifikke regler for hvordan slik sitering skal gjøres. Målet er å vise klart og tydelig hva forskningen er bygget på.

Inntil nylig har det ikke vært så enkelt å sitere datasett selv om de ofte brukes i forskning på blant annet klimagasser. Det er altså i ferd med å endre seg.

– Noe av det viktigste er at data blir etterprøvbare og enklere å inkludere ved sitering i artikler. Det vil si at det er tydelig hvilke data som danner grunnlag for artikler og store rapporter – som for eksempel rapportene til FNs klimapanel (IPCC), sier Lund Myhre.  

Hun forklarer at kunnskapsgrunnlaget blir sikrere når vi kan dokumentere om forskere har brukt samme sett med data i hver sine studier eller om datasettet er nyere eller eldre. 

Data bør være tilgjengelige, forståelige og brukbare

FAIR-prinsippene er generelle og overordnede prinsipper for datahåndtering. De har fått en viktig plass i policyer og retningslinjer for åpne data. 

Å gjøre data såkalt FAIR er noe forskere ved NILU har jobbet med i lang tid. Det har vært som del av flere prosjekter knyttet til EBAS-databasen. 

Å kunne referere til datasett fra databaser som EBAS er viktig når man vil ha FAIR. Det står for «Findable, Accessible, Interoperable og Re-usable» data. På norsk kan vi si gjenfinnbare, tilgjengelige, samhandlende og gjenbrukbare data. 

I praksis betyr dette å håndtere og beskrive forskningsdata slik at de er tilgjengelige, forståelige og brukbare for alle, både nå og i fremtiden. 

Disse prinsippene skal sikre at alle data beskrives og lagres på en måte som gjør dette mulig.

Tre forskere foran vegg
Tre av hovedpersonene bak EBAS FAIR er (fra venstre) Jan Øyvind Låte, Markus Fiebig og Cathrine Lund Myhre.

Systemutvikler Jan Øyvind Låte jobber også i atmosfære- og klimaavdelingen. Han er en av flere som har styrket EBAS-teamet på NILU de siste årene for å jobbe med nettopp sitering av datasett.

Systematisk arbeid med FAIR-data i EBAS startet i 2019. Sammen med Paul Eckhardt begynte Låte på arbeidet med å sette opp en automatisk arbeidsflyt i 2022. 

To år senere er arbeidsflyten på plass.

Forskere kan sitere datasett fra databasen EBAS

– Arbeidet teamet har utført, har gjort at vi har kommet et godt stykke på vei til å implementere FAIR i EBAS, sier Låte.

Noenlunde enkelt sagt fører den automatiske arbeidsflyten til at hver gang noen gjør endringer i et datasett i EBAS, lages det automatisk en landingsside med informasjon om datasettet. Siden beskriver hvilket stoff som er målt, hvor målingene er foretatt, i hvilket tidsrom og av hvem, med mer. 

Det er altså enkelt å se om det er gjort endringer og om det er kommet til nyere versjoner av datasettet.

I tillegg lages en tilhørende NetCDF-fil for datasettet. NetCDF er et standardisert filformat. Det blir brukt i forskning og vitenskap for å lagre, organisere og utveksle datasett. Det benyttes også for alle datasettene i EBAS.

Hva er NetCDF?

NetCDF er et standardisert filformat. Det brukes i forskning og vitenskap for å lagre, organisere og utveksle datasett. Filformatet sørger for blant annet metoder for å håndtere store flerdimensjonale tabeller slik som klimadata, atmosfæriske målinger og miljødata.

Se også NetCDF: Introduction and Overview

Etter at landingssiden og NetCDF-filen er på plass, blir det lastet opp metadata til DataCite. Den lager igjen en såkalt DOI-lenke under https://doi.org. Et eksempel på en DOI-lenke er https://doi.nilu.no/doi/FNN8-T9NJ

DOI står for «Digital Object Identifier» og er det samme systemet som brukes for vitenskapelige artikler. DOI-lenker finner du blant annet ved de aller fleste referanser i bunnen av artikler på forskning.no.

– Forskere som bruker datasettene våre, kan med andre ord sitere dem, akkurat som de gjør med artikler. I skrivende stund inneholder EBAS over 300.000 landingssider som kan siteres med DOI-lenker, sier Låte.

Slik ser DOI-landingssidene ut

Eksempel: Landingsside med informasjon om ozondata fra Birkenesobservatoriet utenfor Kristiansand: EBAS DOI Landing page - (nilu.no)

Eksempel: Landingsside med informasjon om absorberende partikkeldata fra Zeppelinobservatoriet på Svalbard: EBAS DOI Landing page - (nilu.no)

Sitering er en anerkjennelse

Seniorforsker Markus Fiebig har ledet utviklingen. Han er veldig glad for å ha fått på plass den nye funksjonaliteten.

– Forskerne som produserer disse måledataene og lange tidsseriene, legger mye arbeid i å opprettholde god nok målekvalitet til at vi kan oppdage endringer i atmosfæren på et tidlig tidspunkt. At andre forskere nå kan sitere datasettene deres, gir opphavsforskerne anerkjennelsen de fortjener, sier han.

Han forklarer at for å gjøre data FAIR kreves det en del tjenester som skal gjøre dataene enkle å bruke. 

– Identifiserbare og siterbare data er en nøkkelfunksjon i denne sammenhengen, forklarer Fiebig.

EBAS-databasen

EBAS-databasen er en av verdens største databaser for måledata av atmosfærens sammensetning, målt ved bakkestasjoner. EBAS drives av NILU på Kjeller utenfor Oslo. Dataene i EBAS brukes av klima- og miljøforskere over hele verden. Databasen inneholder data fra 84 land, fordelt på 1.358 ulike bakkestasjoner som leverer data om totalt 818 atmosfæriske variabler – som for eksempel sporgasser, ozon, karbonpartikler og pollen.

I 2023 fikk EBAS 2.494 innleveringer av data. Alle data blir håndtert og kvalitetskontrollert av EBAS-gruppen. I 2022 lastet brukere i mer enn 50 land ned til sammen over 7.000 år med data fra EBAS.

Bak de relativt enkle EBAS-landingssidene ligger det en del infrastruktur. Selve prosess-flyten er håndtert av Apache Airflow. Landingssidene blir lagret i MongoDB og NetCDF-filene blir håndtert av Thredds Data Server.

Powered by Labrador CMS