Saken er produsert og finansiert av Universitetet i Bergen - Les mer

Jakter på nye ord

Hver gang norske journalister lager et nytt ord, blir det registrert av nyordjegerne i Norsk Aviskorpus. Og værsågod, der fikk dere ett til!
17.4 2009 05:00


Nytt ord: Flydokrangel. (Faksimile VG Nett)

Flydokrangel. Prinsessebrød. Halvkvalme. Frihandelsekstremister. Supersamen. Slemmisme.

Bare et knippe nyord som i det siste har blitt registrert i listene til avis.uib.no.

Hos Unifob Aksis og deres Aviskorpus går datamaskiner hvert eneste døgn gjennom nettutgavene til ti norske aviser.

Avansert programvare jobber med å skille selve artiklene fra all den andre teksten (tenk skrot som ”les mer her” og utallige henvisninger til andre sider), og nye ord blir registrert i en database.

Siden starten i 1998 har prosjektet samlet 1,6 millioner artikler, og rundt 700 millioner ord.

Overvåker språket

Ifølge prosjektleder Gisle Andersen er det tre bruksområder for alt materialet som blir samlet inn.

– Det første er språkvitenskapelig forskning. Dette gir et veldig godt empirisk grunnlag for studier av det norske språk, forteller han.

– For det andre kan dette arkivet si noe om forekomsten av nye ord i media. Hvilke ord som fester seg i språket og hvilke som forsvinner ut. Siden arkivet vårt er så oppdatert, kan man følge dette fra dag til dag.

– Vi kan se når et ord først ble brukt i norske medier, og hvordan det sprer seg, sier Andersen.

For å vise et eksempel søker han opp ”Barack Obama” i søkesystemet. Fra en beskjeden start i 2004 har omtalen av USAs nåværende president naturlig nok skutt i været det siste året. Også ordet ”blogg” har gått fra å være ikke-eksisterende på 1990-tallet til utbredt bruk på 2000-tallet.

– Det tredje bruksområdet er arbeid med språkteknologi. Om man vil lage programmer som gjenkjenner tale, trenger man store tekstmengder for å utarbeide statistikk og modeller som programmet kan støtte seg på, forteller Andersen.

Nye ord

Men det er samlingen av nyord som har ført til den største interessen blant folk. En oppdatert liste med ord fra det siste døgnet ligger ute på avis.uib.no, og blir flittig brukt. Ordene lenker direkte til artikkelen hvor de opprinnelig ble brukt.

Ny Tid henter blant annet stoff til spalten ”Ukens nyord” herfra, og ifølge Andersen og Hofland har Nytt på Nytt ringt til dem og spurt om de kan bruke listen i programmet.


Nytt ord: Prinsessebrød. (Faksimile Nordlys.no)

Hver dag legges det til mellom 200 000 og 250 000 ord i databasen. Av disse er rundt 1000-1500 nyord.

Liten engelsk innflytelse

Programmet plukker også ut såkalte ”anglisismekandidater”. Disse ordene har ortografiske trekk som gjør dem gjenkjennelige som engelske ord som opptrer i norsk.

– Dette er et vesentlig bidrag her. Det er mange som er bekymret for språkets utvikling og om engelsk tar over, men vi tilbyr statistikk på dette, sier Andersen.

– Så tar engelsk over?

– Nei, bare rundt fem prosent av nyordforekomstene er i det hele tatt anglisismekandidater. Det er atskillig flere nyord-dannelser av typen ”hummergutt”, forteller Andersen, og viser hvordan listen med nyord også speiler litt av hva som har skjedd i media det siste døgnet.

”Hummergutten” var en advarsel fra en kvakksalver-barnelege om hva som kunne skje om man spilte for mye tv-spill.

Avsluttes i år


Knut Hofland og Gisle Andersen konsulterer listen med nye ord. (Foto: Walter Wehus)

Knut Hofland forteller at de fleste land har samlet et stort nasjonalt korpus av tekst og tale.

– Land som Storbritannia, Nederland og Tsjekkia har dette, men ikke Norge. Disse landene bruker blant annet romaner for å utgjøre teksten. Vi jobber på en annen måte, innenfor én enkelt sjanger: nettjournalistikk. Det er en mer effektivt og økonomisk måte å bygge opp en stor tekstdatabase, som likevel består av kvalitetssikret tekst.

– Dessuten er de fleste korpuser statiske med et visst antall tekster; vår er dynamisk og kan brukes til å overvåke språkutviklingen fra dag til dag, måned til måned, år til år, sier Hofland.

Norsk Aviskorpus er under utvikling, og selve prosjektet avsluttes i år. Da er målet å ha et tekstmateriale som er svært godt og kvalitetssikret.

Teknologien skal også finpusses frem til da, slik at den skal bli enda bedre til å sile ut artiklene fra informasjonsflommen på internettsidene. Men tekstinnsamlingen skal fortsette etter prosjektets slutt.

– Målet vårt er å gjennomføre et bredt anlagt studium av nyorddanning i norsk. I mellomtiden skal dette systemet gå og sanke inn informasjon uten oss, forteller Andersen.

I mellomtiden blir norske journalisters tabloidord og -vendinger registrert, analysert og arkivert til senere bruk. Og, for å avslutte med enda et nyord, kan det ikke bli avpublisert.

forskning.no ønsker en åpen og saklig debatt. Vi forbeholder oss retten til å fjerne innlegg. Du må bruke ditt fulle navn. Vis regler

Regler for leserkommentarer på forskning.no:

  1. Diskuter sak, ikke person. Det er ikke tillatt å trakassere navngitte personer eller andre debattanter.
  2. Rasistiske og andre diskriminerende innlegg vil bli fjernet.
  3. Vi anbefaler at du skriver kort.
  4. forskning.no har redaktøraransvar for alt som publiseres, men den enkelte kommentator er også personlig ansvarlig for innholdet i innlegget.
  5. Publisering av opphavsrettsbeskyttet materiale er ikke tillatt. Du kan sitere korte utdrag av andre tekster eller artikler, men husk kildehenvisning.
  6. Alle innlegg blir kontrollert etter at de er lagt inn.
  7. Du kan selv melde inn innlegg som du mener er upassende.
  8. Du må bruke fullt navn. Anonyme innlegg vil bli slettet.

Annonse

Aksis

* Driver forskning og utvikling på områdene språk, språktesting, elektronisk publisering, digitale medier og elektronisk læring.

* Man må registrere seg for å søke i tekstarkivet; nyordene er fritt tilgjengelig.

* I utgangspunktet finansiert internt av Aksis, deretter av Universitetet i Bergen. Siden 2007 har prosjektet blitt finansiert gjennom Forskningsrådets program for Avansert vitenskapelig utstyr.
 

Emneord