Denne artikkelen er produsert og finansiert av NILU - les mer.
Det finnes spesifikke regler for hvordan forskere siterer andre forskere. Målet er å vise klart og tydelig hva forskningen er bygget på.(Illustrasjonsfoto: Shutterstock / NTB)
Nå kan forskere lenke direkte til data om atmosfæren i vitenskapelige artikler
– Kunnskapsgrunnlaget blir sikrere når vi kan dokumentere om forskere har brukt samme sett med data i hver sine studier eller om datasettet er nyere eller eldre, sier forsker.
Tidligere har det ikke vært så enkelt å finne ut nøyaktig hvilke datasett som er brukt i ulike vitenskapelige artikler.
Men nå kan forskere – og andre – lenke til eller sitere ulike data om atmosfæren fra EBAS.
– Når forskningsdata er sporbare, blir også vitenskapen
basert på dem sporbar og mulig å etterprøve. Det er hovedpoenget med å gjøre
datasettene lettere å referere til, sier seniorforsker Cathrine Lund Myhre.
Hun
jobber i NILUs atmosfære- og klimaavdeling.
Hva er en vitenskapelig artikkel?
En vitenskapelig artikkel er skrevet av en eller flere forskere eller fageksperter og publiseres i et vitenskapelig tidsskrift. De henvender seg særlig til andre forskere og fageksperter og skal bidra til å videreutvikle kunnskap innenfor fagområdet.
Før artikkelen publiseres, vurderer andre eksperter innenfor faget bidraget kritisk. Det kalles fagfellevurdering.
Det Lund Myhre snakker om, kalles som regel sitering. Det
betyr at du viser til andres forskning eller resultater når du skriver om din
egen forskning.
Det finnes spesifikke regler for hvordan slik sitering skal
gjøres. Målet er å vise klart og tydelig hva forskningen er bygget på.
Inntil nylig har det ikke vært så enkelt å sitere
datasett selv om de ofte brukes i forskning på blant annet klimagasser. Det er
altså i ferd med å endre seg.
– Noe av det viktigste er at data blir etterprøvbare og
enklere å inkludere ved sitering i artikler. Det vil si at det er tydelig
hvilke data som danner grunnlag for artikler og store rapporter – som for
eksempel rapportene til FNs klimapanel (IPCC), sier Lund Myhre.
Hun forklarer at kunnskapsgrunnlaget blir sikrere
når vi kan dokumentere om forskere har brukt samme sett med data i hver sine
studier eller om datasettet er nyere eller eldre.
Data bør være tilgjengelige, forståelige og brukbare
FAIR-prinsippene er generelle og overordnede prinsipper for datahåndtering. De har fått en viktig plass i policyer og retningslinjer for åpne data.
Å gjøre data såkalt FAIR er noe forskere ved NILU har jobbet med i lang tid. Det har vært som del av flere prosjekter knyttet til EBAS-databasen.
Å kunne referere til datasett fra databaser som EBAS er
viktig når man vil ha FAIR. Det står for «Findable, Accessible, Interoperable
og Re-usable» data. På norsk kan vi si gjenfinnbare, tilgjengelige,
samhandlende og gjenbrukbare data.
I praksis betyr dette å håndtere og beskrive
forskningsdata slik at de er tilgjengelige, forståelige og brukbare for alle,
både nå og i fremtiden.
Disse prinsippene skal sikre at alle data beskrives og
lagres på en måte som gjør dette mulig.
Systemutvikler Jan Øyvind Låte jobber også i
atmosfære- og klimaavdelingen. Han er en av flere som har styrket EBAS-teamet
på NILU de siste årene for å jobbe med nettopp sitering av datasett.
Annonse
Systematisk arbeid med FAIR-data i EBAS startet i 2019. Sammen med Paul Eckhardt begynte Låte på arbeidet med å sette opp en automatisk arbeidsflyt i
2022.
To år senere er arbeidsflyten på plass.
Forskere kan sitere datasett fra databasen EBAS
– Arbeidet teamet har utført, har gjort at vi har
kommet et godt stykke på vei til å implementere FAIR i EBAS, sier Låte.
Noenlunde enkelt sagt fører den automatiske arbeidsflyten
til at hver gang noen gjør endringer i et datasett i EBAS, lages det automatisk
en landingsside med informasjon om datasettet. Siden beskriver hvilket stoff
som er målt, hvor målingene er foretatt, i hvilket tidsrom og av hvem, med mer.
Det er altså enkelt å se om det er gjort
endringer og om det er kommet til nyere versjoner av datasettet.
I tillegg lages en tilhørende NetCDF-fil for datasettet. NetCDF er et
standardisert filformat. Det blir brukt i forskning og vitenskap for å lagre,
organisere og utveksle datasett. Det benyttes også for alle datasettene i EBAS.
Hva er NetCDF?
NetCDF er et standardisert filformat. Det brukes i forskning og vitenskap for å lagre, organisere og utveksle datasett. Filformatet sørger for blant annet metoder for å håndtere store flerdimensjonale tabeller slik som klimadata, atmosfæriske målinger og miljødata.
Etter at landingssiden og NetCDF-filen er på plass, blir det
lastet opp metadata til DataCite. Den lager igjen en såkalt DOI-lenke under
https://doi.org. Et eksempel på en DOI-lenke er https://doi.nilu.no/doi/FNN8-T9NJ.
DOI står for «Digital Object Identifier» og er det
samme systemet som brukes for vitenskapelige artikler. DOI-lenker finner du blant annet ved de aller fleste referanser i bunnen av artikler på forskning.no.
– Forskere som bruker datasettene våre, kan med andre ord sitere
dem, akkurat som de gjør med artikler. I skrivende stund inneholder EBAS over
300.000 landingssider som kan siteres med DOI-lenker, sier Låte.
Slik ser DOI-landingssidene ut
Eksempel: Landingsside med informasjon om ozondata fra Birkenesobservatoriet utenfor Kristiansand: EBAS DOI Landing page - (nilu.no)
Eksempel: Landingsside med informasjon om absorberende partikkeldata fra Zeppelinobservatoriet på Svalbard: EBAS DOI Landing page - (nilu.no)
Sitering er en anerkjennelse
Seniorforsker Markus Fiebig har ledet
utviklingen. Han er veldig glad for å ha fått på plass den nye
funksjonaliteten.
Annonse
– Forskerne som produserer disse måledataene og lange tidsseriene, legger mye arbeid i å opprettholde god nok målekvalitet til at vi kan oppdage endringer
i atmosfæren på et tidlig tidspunkt. At andre forskere nå kan sitere datasettene
deres, gir opphavsforskerne anerkjennelsen de fortjener, sier han.
Han forklarer at for å gjøre data FAIR kreves det en del tjenester som skal
gjøre dataene enkle å bruke.
– Identifiserbare og siterbare data er en
nøkkelfunksjon i denne sammenhengen, forklarer Fiebig.
EBAS-databasen
EBAS-databasen er en av verdens største databaser for måledata av atmosfærens sammensetning, målt ved bakkestasjoner. EBAS drives av NILU på Kjeller utenfor Oslo. Dataene i EBAS brukes av klima- og miljøforskere over hele verden. Databasen inneholder data fra 84 land, fordelt på 1.358 ulike bakkestasjoner som leverer data om totalt 818 atmosfæriske variabler – som for eksempel sporgasser, ozon, karbonpartikler og pollen.
I 2023 fikk EBAS 2.494 innleveringer av data. Alle data blir håndtert og kvalitetskontrollert av EBAS-gruppen. I 2022 lastet brukere i mer enn 50 land ned til sammen over 7.000 år med data fra EBAS.
Bak de relativt enkle EBAS-landingssidene ligger det en del infrastruktur. Selve prosess-flyten er håndtert av Apache Airflow. Landingssidene blir lagret i MongoDB og NetCDF-filene blir håndtert av Thredds Data Server.