DENNE ARTIKKELEN ER PRODUSERT OG FINANSIERT AV NASJONALBIBLIOTEKET - LES MER.

– Spæll sangen fra byn’sjla! Nå får taleassistenter hjelp til å forstå norske dialekter
Nå har språkteknologer knekt koden for å få Siri eller Alexa til å skjønne norske dialekter.
Har du noen gang bedt Siri eller Alexa om å ringe en venn og fått beskjed om at hun ikke forstår deg? Sitter du i bilen og ber taleassistenten spille en sang, men må legge om til bokmål for å få det til?
Denne dialektnøtta har språkteknologene på Nasjonalbiblioteket nå gjort et arbeid for å knekke.
Å spille av en sang, åpne en e-post eller å ringe noen er ofte det man bruker talestyring til. Enten det er på telefonen eller i bilen.
Stor variasjon av dialekter
Norge er et land med stor variasjon av dialekter. Det kan by på utfordringer når man skal be taleassistenten løse små – og noen ganger større – oppgaver.
I dag er assistentene bedre på noen dialekter og sannsynligvis er det østlendingene som har det lettest. Forskjellene i uttale, dialektord og talemåter mellom siddiser og ranværinger er ikke bare enkelt for datamaskinene å tyde.

Det er dette problemet språkviter Marie Iversdatter Røsok, språkteknolog Per Erik Solberg og kollegaene i Språkbanken ved Nasjonalbiblioteket vil løse.
Har samlet inn 10.000 ytringer
Derfor har de nå hentet inn 10.000 ytringer på forskjellige norske dialekter. Disse er så gjort tilgjengelige for leverandører av taleassistenter.
Ved hjelp av alle disse forskjellige setningene og kommandoene kan den kunstige intelligensen som taleassistentene bruker, lære seg hvordan forskjellige norske dialekter høres ut.
Følgen kan være at de for eksempel blir bedre i stand til å forstå trøndersk palatalisering. Palatelisering er når man sier mannj og kvellj i stedet for for mann og kveld.
Hvordan lærer man en datamaskin dialekt?
Språkteknologene startet med å undersøke grundig hvilke funksjoner taleassistenter faktisk kan styre i dag.
– Dette gjorde vi ved å gå gjennom det andre har skrevet om dette. Vi beskrev også selv de forskjellige funksjonene vi fant på en iPhone, forteller Marie Iversdatter Røsok.
Deretter ble det satt opp kategorier. De beskriver hva taleassistenten skal brukes til.
– Det kan for eksempel være å åpne en melding, ta i bruk podkastappen eller stille vekkerklokken på mobilen. Til slutt satt vi oss ned og rett og slett skrev setninger vi selv ville sagt til en taleassistent innenfor disse kategoriene, sier Røsok.

Ytringene taleassistentene skal ta i bruk for å lære dialekter, er gjenkjennelige for de fleste som har prøvd talestyring. Det er kommandoer som «skru på lydløs», «åpne ny melding» og «spill neste sang».
Delte inn i fem ulike dialektområder
Alt ble lest inn av elleve forskjellige personer fra fem ulike dialektområder. Blant annet fra Rana, Stavanger, Klepp og Jostedal.
Blant de som leste inn, var det en av hvert kjønn fra hvert dialektområde. Alderen deres var fra 25 til 59 år. Til sammen var det rundt ti tusen varianter av setningene som ble lest inn.
– Først ba vi innleserne lese inn alle ytringene slik de var skrevet. Deretter skulle de snakke mer fritt. For å få det best mulig ba vi dem formulere seg akkurat slik de ville sagt kommandoen på sin dialekt, forklarer Røsok.
I tillegg brukte teknikerne to forskjellig mikrofoner. En i god kvalitet og en på en telefon. Dette var for å simulere lydkvaliteten når man faktisk bruker talestyring.
I etterkant ble alle de muntlige ytringene sammenstilt med ytringer som var skrevet på bokmål og nynorsk, slik at de kan leses av datamaskinene.
Kan være nyttig innen velferd
Per Erik Solberg har vært med å utvikle dialektsettet sammen med Røsok. Han mener det kan være viktig for mennesker med fysiske utfordringer å ruste opp taleassistentene til å forstå oss bedre.
– Nytten av å gjøre taleassistene bedre til å forstå dialekter handler ikke bare om å spille av musikk i bilen. Det kan for eksempel brukes i velferdsteknologi. For eldre brukere, som ikke er like godt vant med å bruke taleassistenter, kan det være viktig at de faktisk blir forstått på dialekten sin, sier Solberg.
Røsok forklarer at det er fullt mulig å legge til helt andre setninger og kommandoer enn det de har laget nå.
– Vi kan også lage datasett der innleserne har eldre stemmer eller som inneholder kommandoer som for eksempel fungerer på døråpnere eller medisindispensere, sier hun.
Viktig språkpolitisk verktøy
Alle de innleste ytringene ligger nå klare for gratis nedlastning på Språkbankens ressursnettsider. Det inkluderer også fra de store tilbyderne av taleassistenter, som Google og Apple.
Men Solberg forklarer at de ikke kan vite om det allerede er tatt i bruk. Teknologiselskapene holder kortene tett til brystet.
– Den eneste måten vi kan finne ut om datasettene blir tatt i bruk, er å følge med og se om taleassistentene blir bedre til å forstå dialekter. Siden denne samlingen med ytringer er laget slik at de kan implementeres direkte, tror vi det er svært gode sjanser for at dette blir en del av verktøykassene til de som leverer taleassistenter, forteller Solberg.
Solberg tror at arbeidet Nasjonalbiblioteket legger ned, ikke er noe de store teknologiselskapene har insentiv eller kompetanse til å gjøre selv.
Å utvikle slike norske ressurser er dermed et viktig språkpolitisk verktøy. De sikrer at taleassistentene fungerer godt på norsk, som i verdenssammenheng er et lite språk.
Les også disse sakene fra Nasjonalbiblioteket:
-
Sovjetiske spionkart over Norge avslører omfattende etterretning og mystiske tabber
-
Hvordan sang de på 1600-tallet?
-
I middelalderen var øst øverst på kartet – og folk trodde ikke at jorden er flat
-
Nå tekster kunstig intelligens norsk tale nesten like godt som et menneske
-
Nå skriver norsk-tamilene sin egen historie
-
Vibeke Løkkebergs ukjente dokumentarfilm møter publikum etter 50 år
forskning.no vil gjerne høre fra deg!
Har du en tilbakemelding, spørsmål, ros eller kritikk? TA KONTAKT HER