Snakk dialekt til kjøleskapet

I Norge tar vi språk på alvor. Forskningsprogrammet KUNSTI er et viktig skritt på veien mot å sikre at ikke all muntlig kommunikasjon med fremtidens datadingser må bli på engelsk. Bør norske kjøleskap forstå hardangerdialekt?

Denne artikkelen er over ti år gammel og kan inneholde utdatert informasjon.

Jeg klarer meg fint uten å kunne snakke med kjøleskapet mitt, tenker du kanskje. Det gjør du sikkert, men språkteknologien kommer likevel for fullt den, og nytteverdien er uomtvistelig.

Sparer 100 millioner kroner

Hør bare på dette regnestykket: Flere enn 3 000 sykehusårsverk i Norge er knyttet til skriving av journaler etter diktat. Regner vi en lønnsutgift på 300 000 kroner per årsverk, betyr det en årlig kostnad innpå én milliard kroner.

Dersom vi nøkternt regner med at ny språkteknologi kan kutte denne kostnaden med ti prosent, er altså nesten 100 millioner kroner årlig spart bare på skriving av sykehusjournaler.

I løpet av noen år vil språkteknologi være en integrert del av mange av de tingene vi omgir oss med til daglig, men dette er langt fra enkel teknologi. Store ressurser må brukes for å utvikle programvare som kan forstå deg, og snakke til deg.

Stor jobb med små språk

Problemet med språkteknologien er også at svært mye arbeid må til for hvert enkelt språk hvor teknologien skal anvendes. For et lite land med to skriftspråk (bokmål og nynorsk) og en rik flora av dialekter, blir dette en større jobb enn hva det er for hele den engelsktalende verden å få sitt språk gjort tilgjengelig for maskinene.

Fra Forskningsrådets side er forskningsprogrammet Kunnskapsutvikling for norsk språkteknologi (KUNSTI) under Området for kultur og samfunn et krafttak på området.

I alt 75 millioner kroner satses over fem år. Programmet følger opp tidligere prosjekter finansiert av Forskningsrådet, blant annet prosjektet SPODIS på Norges teknisk-naturvitenskapelige universitet (NTNU).

Tasteløs mobiltelefon

Gjennom flere beslektede forskningsprosjekter skal KUNSTI bidra til å utvikle og fremme bruken av norsk språk i vår fremtidige datahverdag.

Ett av prosjektene - BRAGE - er et samarbeid mellom NTNU, Telenor FoU og Sintef Tele og Data. Målet er å forbedre taleteknologi og dialogbasert menneske-maskin-kommunikasjon, og oppmerksomheten blir rettet mot utstyr en tror folk vil bruke i fremtidens hverdag. For eksempel den tasteløse mobiltelefonen.

Prosjektet FONEMA har som mål å frembringe naturtro norsktalende datamaskinstemmer. Store mengder med innleste lydsekvenser må til for å skape slike stemmer. Forskerne har i tillegg ambisjoner om å skape norske stemmer med varierende personlighet, blant annet «sentralborddamen» og «ungdommen».

Norsk språkbank

Flere land ser nå med alvorlige øyne på utviklingen innenfor språkteknologien, og ikke minst trusselen om at vi stort sett bare skal kunne snakke engelsk til fremtidens maskiner. For å unngå en slik utvikling, må det for hvert enkelt språk etableres en stor språkbank.

Dette vil koste, og det offentlige må belage seg på å betale, konkluderer en fersk rapport lagt fram av en prosjektgruppe nedsatt av Kultur- og kirkedepartementet.

Prisen for Norsk språkbank blir om lag 100 millioner kroner, mener gruppen, som samtidig påpeker at dette likevel ikke er mer enn hva norske sykehus altså alene kan spare inn på journalskriving i løpet av ett år.

Store mengder tekst og tale

Norsk språkbank vil samle inn store mengder tekst og tale innenfor bokmål og nynorsk. Våre mange dialekter må også inn i den digitale banken.

Alt dette materialet må kodes i henhold til internasjonale standarder, og deretter gjøres tilgjengelig (gratis eller billig) for kommersielle aktører med aktuelle produkter.

Norsk språkbank vil også åpne for ny forskning på det rike språkmangfoldet vi har i Norge. Trolig vil datalingvistmiljøet ved ett eller flere av universitetene få en viktig rolle i denne store innsamlingsjobben.

Powered by Labrador CMS