Eksempel på en setning skrevet på konservativt bokmål:
«Kvinnen ble oppfordret til selv å legge alle kortene på bordet med hensyn til hva hun drev med hjemme i fritiden sin.»
Samme setning kan også skrives slik, med radikalt bokmål:
«Kvinna blei oppfordra til sjøl å legge alle korta på bordet med omsyn til hva hun dreiv med heime i fritida si.»
Kilde:
Riksmålsforbundet
Universitetet i Oslo har en samlet over 100 millioner ord i en svær bokmåls-database.
– Dette er en strukturert samling med over hundre millioner ord fra så ulike tekster som romaner, lærebøker, masteroppgaver, blogger, tidsskrifter og NRK-tekster. Tekstutvalget er basert på SSBs undersøkelser av folks lesevaner. Nesten halvparten av tekstene er sakprosa, en fjerdedel er skjønnlitteratur, en femdel er aviser, og resten er TV-tekster og upubliserte tekster, forteller primus motor for denne bokmålssamlingen, professor i nordiske språk, Ruth E. Vatvedt Fjeld ved Universitetet i Oslo.
Det er like vanlig å skrive fram som å frem. Men bare én av seks tekster er skrevet på et gjennomført radikalt bokmål (se faktaboks), ifølge masteroppgaven til universitetslektor i nordiske språk, Kjersti Wictorsen Kola.
– Radikalt bokmål forekommer sjeldent. Fem av seks tekster er skrevet på konservativt bokmål, sier hun.
I mastergraden sin undersøkte hun i fjor den statistiske fordelingen i radikal og konservativ bruk av bokmål, i den store tekstsamlingen. Hun fant at det nesten ingen bruker a-endelser i fortidsformer av svake verb – som for eksempel hoppa eller pusta, men i mange tilfeller er radikale og konservative bokmålsformer omtrent like vanlige.
Det er nesten like mange som bruker ben som bein. Og det er nesten like populært å skrive syv som sju.
Universitetets enorme tekstsamling, med det lite fengende navnet «Leksikografisk bokmåls-korpus», er en dokumentasjon på hvordan bokmål er blitt brukt som skriftspråk gjennom tretti år, fra 1985 til 2014.
Alle tekstene er merket med forfatterens kjønn, alder og hvor de er vokst opp. Det gjør det mulig å lete etter spesielle, språklige særtrekk hos kvinner og menn, unge og gamle og om det er forskjellig bruk av bokmål på Østlandet og i Nord-Norge. Ordene er dessuten grammatisk merket med ordklasse.
Skattejakten
For noen år siden brukte Ruth E. Vatvedt Fjeld dette korpuset, som en slik samling kalles, til å slå fast at det er langt vanligere å skrive uken enn uka, jorden enn jorda og solen enn sola. Unntaket var NRK-tekstene. Der vant a-endelsene en soleklar seier.
Nå er hun i gang med en ny skattejakt. Hun skal undersøke bruken av fraser, altså brukskombinasjonen av flere ord. Et eksempel er hvordan folk tar selvmord. Noen «begår selvmord», andre «tar selvmord» og noen «gjør selvmord».
– I dagens ordbøker er frasene ofte hentet fra gamle ordbøker, men det er aldri gjort en statistisk analyse av hvilke ord som hyppigst forekommer sammen.
Vatvedt Fjeld ønsker også å undersøke i hvilken grad fraser brukes feil. En som skriver «ta hele skrittet ut», mener kanskje den riktige varianten «ta skrittet helt ut».
En av de mange overraskelsene hun fikk, var da hun oppdaget at dommere ikke alltid er sikre på hva de mener med å «legge til grunn». Selv om man skulle anta at tingenes tilstand er bevist når dommere i rettsdokumenter legger noe til grunn, bruker dommerne ofte det samme uttrykket selv om de bare går ut ifra eller antar noe.
Unngår skjevt bilde
Vatvedt Fjeld poengterer at bokmålskorpuset er Skandinavias eneste vektete tekstsamling. Det betyr at forskerne kan dokumentere spredningen av ord eller uttrykk og finne ut hvor vanlig det er å finne dem i ulike typer tekster.
Alle de andre skandinaviske korpusene, og da snakker vi om ordsamlingene både for nynorsk, dansk og svensk, er uvektet.
I uvektete korpus er faren til stede for at forskerne baserer seg på intuisjon når de jakter på sentrale ord og at de ikke fanger opp om faguttrykk er blitt en del av allmennspråket. Faren er også til stede for å gi et skjevt bilde av ordets status i språket. Hvis ett ord er hyppig brukt av bare én sentral forfatter, kan det få altfor mye plass i uvektete korpus.
Annonse
– Da blir ordbøkene feil. I et vektet korpus kan jeg dessuten undersøke fordelingen av uttrykk hos kvinnelige og mannlige eller unge og eldre forfattere. Hvis vi baserer oss på et tilfeldig ordutvalg, har vi ingen muligheter til å sjekke dette.
Noen ord har begrenset levetid.
– Et eksempel er askefast. Det er ingen grunn til å ha med slike midlertidige underholdningsord i ordbøker. Poenget er å dokumentere de allmenne ordene vi kan regne med å komme bort i, og dermed ha behov for å slå opp.
Dokumenterer språket
For noen år siden hadde UiO fire leksikografer i bokmål. Nå er tre av dem gått av med pensjon. Vatvedt Fjeld, som nylig fylte 67 år, er nå landets siste leksikografiske bokmålsvokter.
Meningen var at bokmålskorpuset skulle bli grunnstammen i den nye oppdateringen av bokmålsordboken, men styret ved Institutt for lingvistiske og nordiske studier har gjort et vedtak om ikke å videreføre forvaltning av UiOs språksamlinger, som ordbøkene bygger på.
Vatvedt Fjeld synes det er synd hvis fremtidens bokmålsordbok ikke blir bygd på korpuset.
– Den eksisterende ordboken er stort sett laget ut ifra gamle ordbøker, intuisjon og uten faglig grunnlagsmateriale. Jeg bygde derfor opp det leksikografiske korpuset for å kunne få et godt grunnlag til den tiltrengte ordbokoppdateringen, påpeker Vatvedt Fjeld.
Et av de mange eksemplene på svakheter hun peker på i dagens ordbok, er den foreldete frasen «Gjøre sine hoser grønne» under adjektivet grønn. Det mer moderne uttrykket «å ha grønne fingre» er derimot ikke med.
Ettersom Vatvedt Fjeld ikke har fått midler til å vedlikeholde korpuset, vil det etter hvert ikke bli mulig å bruke denne tekstsamlingen til å studere de nyeste endringene i bokmål.
– Hvis korpuset skal kunne brukes til ordboksarbeid, må det stadig fylles opp med nye tekster. Hvis ikke får vi hull i beskrivelsen av det norske ordforrådet. Inntil videre er vi nødt til å gjette oss til eller google opp hvilke ord og uttrykk som er kommet i vanlig bruk etter 2014. Da blir det mer tilfeldig hva slags treff vi får, beklager Vatvedt Fjeld.
Spørsmålet om hvem som skal overta ansvar for forvaltning av samlingene, ligger nå hos Kulturdepartementet og Kunnskapsdepartementet, ifølge instituttleder Kristian Emil Kristoffersen ved Institutt for lingvistiske og nordiske studier. Ifølge ham vil ikke arbeidet med å tekstsamlingen nødvendigvis stoppe selv om UiO ikke skal gjøre jobben.
Annonse
– Det vil være naturlig at den institusjonen som får ansvaret for samlingene, viderefører arbeidet med oppbygging av vitenskapelige korpus for både forskning og ordboksproduksjon.