Et dataverktøy skal samle all data fra fysikk og astrofysikk for å teste fysiske teorier. For å gjøre det må utfordringene med Big Data takles. (Illustrasjon: Colourbox)

Skal takle store data for store teorier

Forskere har i dag tilgang på så store mengder data, at det har blitt et problem. Samtidig gir det mulighet til å teste ut fysiske teorier som omfatter hele universet.

GAMBIT

GAMBIT står for “The Global And Modular BSM Inference Tool”

GAMBIT er utviklet av nesten 30 teoretikere og eksperimentalister verden over.

Are Raklev fikk i 2014 støtte til prosjektet gjennom Forskningsrådets satsing «Fellesløftet».

GAMBIT ventes å komme med sin første publikasjon innen svært kort tid.

GAMBIT er et dataverktøy som skal brukes til å utforske nye fysikkteorier ved å bruke alle kjente astrofysiske og partikkelfysiske data. Professor Are Raklev fra Fysisk institutt på Universitetet i Oslo er blant bidragsyterne i prosjektet.

Datamaskiner i dag er blitt ekstremt god til å registrere informasjon. Harddisker og prosessorer med stadig høyere kapasitet har ført til at forskere har muligheten til å samle enorme mengder data. Det kalles Big Data - som er verdifullt på mange måter.

Store datamengder kan for eksempel avsløre mønster forskerne ellers ikke ville ha oppdaget, eller bare i kraft av datamengden gi ny informasjon som de ikke på forhånd kunne ha kjennskap til.

Begrepet Big Data oppstod da forskjellige selskaper kom opp med programvare for å behandle store mengde data for nettopp å avsløre skjulte hemmeligheter i de store datamengdene.

Professor i fysikk og del av GAMBIT, Are Raklev. Foto: Hilde Lynnebakken

– Dette er svært relevant for moderne forskning. Vi har ofte tilgang til så enorme mengder data at vi ikke vet hva vi skal gjøre med den. Det gir forskningen helt nye redskaper og muligheter i fremtiden, for en slik tilgang til fakta har vi aldri vært i nærheten av før, forteller Raklev.

Tester de store teoriene

GAMBIT-prosjektet er internasjonalt.

– Nå består GAMBIT-gruppen av forskere fra hele verden. Vi har eksperter på hvert sitt felt: programmering, teoretisk fysikk, statistikk og eksperimentell fysikk.

Målet er å utvikle et dataverktøy som kan benytte Big Data for å teste de store teoriene innen grunnleggende fysikk.

– Målet er å samle all relevant data innen partikkelfysikk og astrofysikk og bruke denne dataen til å teste eksisterende teorier. Hvordan står de seg når vi tester dem opp mot alt vi vet om universet i dag.

Dette henger sammen med «Teorien om alt», en framtidig teori innen fysikk som - om mulig - vil forene teorien om kvantemekanikk med Einsteins generelle relativitetsteori.

I dag opererer fysikerne med det de kaller standardmodellen, som kort fortalt er en praktisk, men ufullstendig forening av de to modellene.

Plukker lovende hypoteser

– Vi har mange hypoteser om hvordan alt kan henge sammen, men de er bare muligheter. GAMBIT kan hjelpe oss i å plukke ut de hypotesene som er mest lovende. Hvis teori og data ikke stemmer godt overens med hverandre, er det et tegn på at teorien ikke holder mål.

GAMBIT kan ikke gjøre oppdagelser.

– Det er derimot skapt for å teste oppdagelser, teste teorier opp mot alt vi vet om fysikk og ta i bruk all relevant data vi har, sier Raklev.

– Det registreres en enorm mengde informasjon som er relevant. Og datamengdene bare øker i hyppighet. En viktig kilde er all høyenergifysikk som ved CERN. Når CERN kolliderer partikler i superhøy hastighet, så blir enorme mengde data registrert.

Og det er flere kilder.

– Ja, det er snakk om alt vi har av data fra kosmisk stråling og presisjonsinstrumenter som måler fundamentale fysiske fenomener.

Enklere modeller før

På jakt etter fysikkens stordatahemmeligheter er statistikk det store verktøyet. Det er igjennom programmer som bruker statistisk analyse at forskerne har muligheten til å benytte Big Data til det fulle.

Men all denne dataen skaper et statistisk problem. For i de store undersøkelsene med bruk av Big Data gjelder loven om store tall.

–  Vi begynner å se statistiske avvik som i vanlig forskningsøyemed skal bety noe, men som i virkeligheten er en statistisk tilfeldighet, sier Raklev.

Statistisk sett vil det oppstå tilfeldige og falske sammenhenger når man sammenligner svært store datasett. Forskerne har så mye data at mengden i seg selv blir et problem.

– Vår evne til å registrere virkeligheten har faktisk gjort denne typen forskning vanskeligere i dag enn den var før, da de opererte med enklere modeller, med færre parametere.

Og det er her GAMBIT kommer inn. Dataverktøyet er nemlig bygd slik at det kan forholde seg til statistiske tilfeldigheter på en ordentlig måte.

– Hvordan klarer dere å unngå statistiske tilfeldigheter?

– Det vi har gjort er å samle en rekke av de beste kjente statistiske metodene for store datasett, i form av såkalte algoritmer, sammen i en pakkeløsning. En slags lærebok i store datasett, som enkelt kan brukes på nye modeller og nye data. GAMBIT gir fysikere med modeller med mange parametere en oppskrift på hvordan de skal behandle Big Data.

Regner på Higgs

GAMBIT-prosjektets logo. (Foto: Illustrasjon: GAMBIT)

Raklev tror GAMBIT kan benyttes innen mange fagfelt, men prosjektet holder seg til sitt eget felt.

– Vi arbeider spesifikt for vårt fagfelt. Vi driver med fysikk.

– Det er det vi bruker GAMBIT til å regne på, men vi tror at slike algoritmer har relevans for andre. Vårt mål er en åpen kode som alle kan ta i bruk. Det skal være et slags gjør-det selv-system inne store datasett.

– Hva gjør egentlig GAMBIT?

– GAMBIT handler om programvare for en stor samling av prosessorer. Det vi teknisk sett gjør er at hver prosessor parallelt tenker på hvert sitt eksperiment for hver sin versjon av modellen. De sender så resultatene sine til en sentral prosessor som sammenligner de forskjellige resultatene og styrer hvordan modellen skal utforskes.

Akkurat nå arbeider GAMBIT med data fra CERN fra oppdagelsen av Higgs-partikkelen.

– Vi har puttet all data tilgjengelig fra Higgs-oppdagelsen inn i modellen og ser på konsekvensene. Hva skjer for eksempel med de forskjellige supersymmetriske modellene når man tar utgangspunkt i det vi nå vet om Higgs-partikkelen?

Raklev tror det kan føre til at enkelte teorier innen fysikkvitenskapen blir utelukket.

– Min forutsigelse er at vi kommer til å ende opp med enkelte supersymmetriske modeller som er utelukket, og andre igjen foretrukket på bakgrunn av de fysiske dataene vi sitter på.

Les mer:

GAMBIT - a Global And Modular Bsm Inference Tool - på nettsidene til Fysisk institutt på Universitetet i Oslo

Powered by Labrador CMS