På jakt etter Babelfisken

Mange har latt seg fascinere av historien om babelfisken, som kan oversette mellom alle språk. Et norsk forskningsprosjekt har nå brakt mulighetene for digitale oversettelser et godt stykke videre.

Publisert

For de fleste nettbrukere er Babelfish forbundet med Yahoos oversettelsestjeneste på nettet. Begrepet er hentet fra klassikeren “Haikerens guide til galaksen” hvor den lille gule babelfisken sitter i menneskenes ører og oversetter mellom alle språk.

(Illustrasjon: Annica Thomsson)
(Illustrasjon: Annica Thomsson)

Yahoos teknologi har til nå vært ansett som den fremste på feltet, men har så langt bare kunnet tilby grov-oversettelser for å få et inntrykk av innholdet til nettsider på fremmede språk.

Går dypere

I en fersk doktoravhandling ved Universitetet i Oslo har språkteknolog Erik Velldal vært med på å utvikle en ny type modell for oversettelse, der han kombinerer statistiske modeller over språkbruk med dypere lingvistisk analyse.

Velldals forskning inngår i et større nasjonalt prosjekt for maskinoversettelse, finansiert av Norges forskningsråd. Metodene som utvikles i avhandlingen har allerede blitt tatt i bruk av andre språkteknologiske forskere internasjonalt.

(Illustrasjon: Annica Thomsson)
(Illustrasjon: Annica Thomsson)

- Mens tidligere systemer gjerne var basert på manuelt definerte regler, er de nyere systemene gjerne basert på statistikk. LOGON-prosjektet, som min avhandling er en del av, har valgt å kombinere begge typer tilnærminger i et hybrid-system.

- De modellene jeg har jobbet med har riktignok vært basert på statistisk analyse, men selve statistikken er basert på dypere lingvistiske strukturer enn det som hittil har vært vanlig, forklarer Velldal.

Maskinlæring

En av utfordringene har vært å finne løsninger som kan få maskinen til å gjenkjenne ulike uttrykk for samme mening og konstruere så flytende setninger som mulig, sier Velldal som har benyttet tekster fra Norsk Turistforenings informasjonsmateriell i arbeidet.

- De fleste av oss vil si ”salt og pepper”, fremfor ”pepper og salt”, selv om meningen er den samme. For å forbedre datamaskiners språkbeherskelse, må vi gjøre dem i stand til å gjenkjenne den beste formuleringen, sier Velldal. Dette kan vi gjøre ved å mate dem med sannsynlighetsmodeller for menneskelig språkbruk.

Aldri perfekt

(Foto: Annica Thomsson)
(Foto: Annica Thomsson)

Ifølge Velldal har de fleste språkteknologer gitt opp visjonen om høykvalitetssystemer med tilnærmet perfekt oversettelsesevne.

- Personlig har jeg ingen tro på at vi noen gang kan få til systemer som kan oversette mer nyanserte tekster som dikt, for eksempel.

- Per i dag arbeider fagmiljøene med begrensede områder som for eksempel oversettelse av tekniske manualer med relativt enkelt språk, sier Velldal.

Han mener det er en fordel at språkteknologien i dag preges mer av realistiske mål enn høytsvevende visjoner.

Tverrfaglig skjæringspunkt

Instituttleder Hanne Gram Simonsen ved Institutt for lingvistiske og nordiske studier sier hun er svært fornøyd med resultatene.

Hun mener de humanistiske fagene trenger språkteknologisk forskning, ikke minst for å trekke med det norske språket i den teknologiske revolusjonen.

- Velldals avhandling er et vellykket prosjekt i skjæringspunktet mellom humaniora, informatikk og matematikk og representerer en viktig type forskning for dagens samfunn, sier Simonsen.

Lenke:

Språkfølelse hos datamaskiner - pressemelding om avhandlingen
LOGON