Denne artikkelen er over ti år gammel og kan inneholde utdatert informasjon.
Det viser en maskinell sammenligning mellom den elektroniske Bokmålsordboka og det nye bokmålskorpuset som nylig ble presentert ved Universitetet i Oslo.
- Sekstiåtter, tvetydighet og filmskaper er også blant kandidatene til ordboka, forteller Carina Nilstun, som har undersøkt resultatene av sammenligningen.
- Det samme gjelder besteforelder, nettside, arbeidsplass og interkulturell. For ikke å snakke om å videreføre og å offentliggjøre.
Nilstun er vitenskapelig assistent ved Institutt for lingvistiske og nordiske studier ved Universitetet i Oslo, og er en av de første som har tatt i bruk det splitter nye og 40 millioner ord store bokmålskorpuset.
Korpuset, som er samlet inn og bearbeidet ved samme institutt under ledelse av Ruth Vatvedt Fjeld, er det først balanserte korpuset over moderne norsk.
65 000 “nye” ord
Den maskinelle sammenligningen viser at det er 65 000 ord eller lemmaer - det vil si grunnformer - i det nye bokmålskorpuset som ikke finnes i dagens versjon av Bokmålsordboka.
Bokmålsordboka er utarbeidet ved Universitetet i Oslo, og er gitt ut i bokform av Kunnskapsforlaget. Den finnes også elektronisk på UiO sine nettsider.
Bokmålsordboka består i dag av rundt 70 000 ord.
Tar tid
Ordboksarbeid tar tid. Så langt har Nilstun rukket å gå gjennom de 5000 første ordene i listen på 65 000 ord som ikke finnes i Bokmålsordboka.
- Veldig mange av ordene som fremstår som nye, kommer av skrivefeil, feiltagging eller transparente sammensetninger av ord, det vil si to eller flere ord som til sammen ikke gir noen ny betydning enn ordene de består av, forteller Nilstun.
- Men mange ord er kandidater til å bli nye ord i ordboken, påpeker hun.
Kandiater
I tillegg til enkeltord, er det også affikser, flerordsuttrykk og forkortelser blant kandidatene til nye ord.
- Affikset kjempe- er en het kandidat. Alt er “kjempe-” nå til dags: Kjempelurt, kjempestor, kjempedårlig og så videre, ramser den unge språkforskeren opp. Det samme gjelder halv-, ny- og ikke-.
Av flerordsuttrykk er først og fremst, rett og slett, stort sett og på forhånd blant kandidatene, mens t.v., st. meld, tlf. og mv. er forkortelser som kan komme inn i boka.
Annonse
Ikke automatisk
Den maskinelle sammenligningen er interessant og gir grunnlag for å vurdere mange nye ord som faktisk blir brukt i dag. Men det er ikke slik at alle de nye ordene som er definert her går rett inn i ordboka.
- Hver enkelt kandidat må bli vurdert av leksikografene. Dette må gjøres manuelt, og dermed tar det tid, sier Nilstun.