DENNE ARTIKKELEN ER PRODUSERT OG FINANSIERT AV NASJONALBIBLIOTEKET - LES MER.
Å spille av en sang, åpne en e-post eller å ringe noen er ofte det man bruker talestyring til. Enten det er på telefonen eller i bilen.(Illustrasjonsfoto: Omid Armin / Unsplash)
– Spæll sangen fra byn’sjla! Nå får taleassistenter hjelp til å forstå norske dialekter
Nå har språkteknologer knekt koden for å få Siri eller Alexa til å skjønne norske dialekter.
Har du noen gang bedt Siri eller Alexa om å ringe en venn og fått beskjed om at hun ikke forstår deg? Sitter du i bilen og ber taleassistenten spille en sang, men må legge om til bokmål for å få det til?
Denne dialektnøtta har språkteknologene på Nasjonalbiblioteket nå gjort et arbeid for å knekke.
Å spille av en sang, åpne en e-post eller
å ringe noen er ofte det man bruker talestyring til. Enten det er på telefonen eller
i bilen.
Stor variasjon av dialekter
Norge er et land med stor variasjon av dialekter. Det kan by på
utfordringer når man skal be taleassistenten løse små – og noen ganger større –
oppgaver.
I dag er assistentene bedre på noen dialekter og sannsynligvis er
det østlendingene som har det lettest. Forskjellene i uttale, dialektord og talemåter
mellom siddiser og ranværinger er ikke bare enkelt for datamaskinene å tyde.
Det er dette problemet språkviter Marie Iversdatter Røsok, språkteknolog Per Erik Solberg og kollegaene i Språkbanken ved Nasjonalbiblioteket vil løse.
Har samlet inn 10.000 ytringer
Derfor har de nå hentet inn 10.000 ytringer på forskjellige norske dialekter. Disse er så gjort tilgjengelige for leverandører av taleassistenter.
Ved hjelp av alle disse forskjellige setningene og kommandoene kan den kunstige intelligensen som taleassistentene bruker, lære seg hvordan forskjellige norske dialekter høres ut.
Følgen kan være at de for eksempel blir bedre i stand til å forstå trøndersk palatalisering. Palatelisering er når man sier mannj og kvellj i stedet for for mann og kveld.
Nå kan taleassistenten lære seg å forstå dette
spæll
sangen fra byn’sjla – spill sangen fra begynnelsen
æ vil vessta kor mytji klokka e – jeg vil vite hvor mye klokka er
korsen dato e det – hvilken dato er det
sle tå høgtalaren – slå av høyttaleren
kest e Nasjonalbiblioteket – hvor er Nasjonalbiblioteket
spel songen atte ittepå – spill sangen igjen etterpå
du lyt åpne meldingi – du må åpne meldingen
Hvordan lærer man en datamaskin dialekt?
Språkteknologene startet med å undersøke grundig hvilke funksjoner taleassistenter
faktisk kan styre i dag.
– Dette gjorde vi ved å gå gjennom det andre
har skrevet om dette. Vi beskrev også selv de forskjellige funksjonene vi fant
på en iPhone, forteller Marie Iversdatter Røsok.
Deretter ble det satt opp kategorier. De beskriver hva taleassistenten skal brukes til.
–
Det kan for eksempel være å åpne en melding, ta i bruk podkastappen eller
stille vekkerklokken på mobilen. Til slutt satt vi oss ned og rett og slett
skrev setninger vi selv ville sagt til en taleassistent innenfor disse
kategoriene, sier Røsok.
Ytringene
taleassistentene skal ta i bruk for å lære dialekter, er gjenkjennelige for de
fleste som har prøvd talestyring. Det er kommandoer som «skru på lydløs», «åpne ny melding» og «spill neste sang».
Delte inn i fem ulike dialektområder
Annonse
Alt ble lest inn av elleve forskjellige personer fra fem ulike dialektområder. Blant annet fra Rana, Stavanger, Klepp og Jostedal.
Blant de som leste inn, var det en av hvert kjønn fra hvert dialektområde. Alderen deres var fra 25
til 59 år. Til sammen var det rundt ti tusen varianter av setningene som ble
lest inn.
– Først ba vi
innleserne lese inn alle ytringene slik de var skrevet. Deretter skulle de snakke
mer fritt. For å få det best mulig ba vi dem formulere seg akkurat slik de ville
sagt kommandoen på sin dialekt, forklarer Røsok.
I tillegg brukte teknikerne to forskjellig mikrofoner. En i god kvalitet og en på en telefon. Dette var for å simulere lydkvaliteten når man
faktisk bruker talestyring.
I etterkant ble alle de muntlige ytringene sammenstilt
med ytringer som var skrevet på bokmål og nynorsk, slik at de kan leses av
datamaskinene.
Kan være nyttig innen velferd
Per Erik Solberg har vært med å utvikle
dialektsettet sammen med Røsok. Han mener det kan være viktig for mennesker med fysiske utfordringer å ruste opp taleassistentene til å forstå oss bedre.
– Nytten av å
gjøre taleassistene bedre til å forstå dialekter handler ikke bare om å spille
av musikk i bilen. Det kan for eksempel brukes i velferdsteknologi. For eldre
brukere, som ikke er like godt vant med å bruke taleassistenter, kan det være
viktig at de faktisk blir forstått på dialekten sin, sier Solberg.
Om prosjektet
Prosjektet deler dialektene
i Norge inn i fire store dialektområder: vestnorsk, østnorsk, trøndersk og
nordnorsk. I tillegg kommer et femte, mindre område: sørvestnorsk, nærmere
bestemt rogalandsdialektene. Disse har trekk som skiller seg fra andre
vestlandsdialekter. De fem områdene dekker til sammen mye av variasjonen i
språklyder og grammatikk i norske dialekter
Røsok forklarer at det er fullt mulig å legge til helt
andre setninger og kommandoer enn det de har laget nå.
– Vi kan også lage
datasett der innleserne har eldre stemmer eller som inneholder kommandoer som
for eksempel fungerer på døråpnere eller medisindispensere, sier hun.
Viktig språkpolitisk verktøy
Alle de innleste ytringene ligger nå klare for gratis nedlastning på Språkbankens ressursnettsider. Det inkluderer også fra de store tilbyderne av taleassistenter, som Google og Apple.
Annonse
Men Solberg forklarer at de ikke kan vite om det allerede er tatt i
bruk. Teknologiselskapene holder kortene tett til
brystet.
– Den eneste
måten vi kan finne ut om datasettene blir tatt i bruk, er å følge med og se om
taleassistentene blir bedre til å forstå dialekter. Siden denne samlingen med
ytringer er laget slik at de kan implementeres direkte, tror vi det er svært
gode sjanser for at dette blir en del av verktøykassene til de som leverer
taleassistenter, forteller Solberg.
Solberg tror at arbeidet Nasjonalbiblioteket legger
ned, ikke er noe de store teknologiselskapene har insentiv eller kompetanse til
å gjøre selv.
Å utvikle slike norske ressurser er dermed et viktig
språkpolitisk verktøy. De sikrer at taleassistentene fungerer
godt på norsk, som i verdenssammenheng er et lite språk.
Hva er Språkbanken ved Nasjonalbiblioteket
Språkbanken er nasjonal infrastruktur for
språkteknologi. Det betyr blant annet at de tilbyr ressurser til
virksomheter som utvikler språkteknologi. Ressursene
bygger i stort grad på den store samlingen av digital tekst fra Nettbiblioteket til Nasjonalbiblioteket.