Oppdag våre andre nettsteder:

Du leter kanskje etter...

Oppdag våre andre nettsteder:

Saken er produsert og finansiert av Norges forskningsråd - Les mer

Data med barnestemme

Det er utfordrende å få datamaskiner til å gjenkjenne og snakke med barnestemme. Norske forskere har funnet enkle og gode løsninger på begge deler.

Norges forskningsråd

Norunn K. Torheim kommunikasjonsrådgiver

torsdag 05. januar 2012 - 05:00

Denne artikkelen er over ti år gammel og kan inneholde utdatert informasjon.

Saken er produsert og finansiert av Norges forskningsråd - Les mer

Barn som trenger taleteknologi skal få bedre hjelpemidler. (Foto: Shutterstock)

Om prosjektet:

Taleteknologiprosjektet «Stemmestyring i multimodal dialog – SMUDI» har hatt støtte fra Forskningsrådets VERDIKT-program siden høsten 2007 og avsluttes til nyttår. Prosjektet ledes av Morten Tellefsen i Media Lunde Tollefsen A/S (MediaLT). SMUDI-forskerne arrangerte nylig avslutningsseminaret «Snakkis».

– Kunstige stemmer likner mer og mer på menneskestemmer, men barn får fortsatt voksenstemmer dersom de trenger hjelpemidler for å snakke, sier Magne Lunde, daglig leder i MediaLT som utvikler hjelpemidler for funksjonshemmede.

– Dette er utgangspunktet for et forskningsprosjekt der vi sammen med bedriften Lingit jobber med å utvikle Norges første kunstige barnestemme, forteller han.

Å lage en ny syntetisk stemme er vanligvis svært tidkrevende. Med finansiering fra Forskningsrådets program for IT for funksjonshemmede tester de derfor ut en helt ny metode.

Høres lovende ut

– Vi tar utgangpunkt i en såkalt masterstemme som er bygget opp på innlesninger av flere tusen setninger fra 3–4 voksne talere. Så gjør vi opptak av ett barn som leser inn et mindre antall setninger. Dette bruker vi til å modifisere masterstemmen slik at den høres ut som en barnestemme, sier Torbjørn Nordgård i Lingit.

Han er også professor i språkvitenskap ved Universitetet i Nordland.

Setningene som barnet leser inn er valgt ut for å dekke en del av den relevante fonetiske variasjonen, det vil si lydskriften, man finner i norsk.

– Masterstemmen vil være styrende for intonasjon, det vil si setningsmelodien, og derfor vil nok resultatet bli en temmelig veslevoksen barnerøst, men det er tross alt bedre enn en voksenstemme, sier Nordgård.

Forskerne skal nå i gang med å teste prøveversjoner av barnestemmen.

– Så langt ser det lovende ut, og vi kan ha på plass første versjon av barnestemmen til sommeren, håper Lunde.

Han sier at det er forsket lite på dette også internasjonalt, og at de med denne måten å utvikle kunstige barnestemmer på, ligger langt framme i verdenssammenheng.

Må forstå barnetalen

Lunde og kollegaene forsker også på talestyring på norsk. Det innebærer blant annet å styre PC-en gjennom å snakke til den i form av talekommandoer.

Magne Lunde i MediaLT. (Foto: Norunn K. Torheim)

Når vi styrer datamaskiner med tale, må datamaskinen gjenkjenne det vi sier. Det er ekstra utfordrende å få datamaskiner til å forstå unge og eldre.

– Barn og unge har annerledes stemme på grunn av kortere taleorgan. For å lage en talegjenkjenner trenger vi relativt store mengder taledata for at gjenkjenneren skal lære seg hvordan de ulike lydene uttales. Det finnes dessverre lite taledata for barnestemmer, forteller professor Torbjørn Svendsen ved NTNU.

Han er en av nestorene innen norsk taleteknologi og samarbeider med forskerne i prosjektet SMUDI som er støttet av Forskningsrådets VERDIKT-program og Kunnskapsdepartementet.

På et nylig avholdt seminar om taleteknologi fortalte Svendsen hvordan de på en relativt enkel og elegant måte har løst problemene med gjenkjenning av barnetale.

De tok utgangspunkt i at lengden på taleorganet påvirker hvordan energien i talen fordeles i frekvens og brukte en matematisk formel for å få energifordelingen i voksentale til å likne mer på energifordelingen hos barn.

– Den omformede voksentalen ligner også lydmessig mer på tale fra barn. Vi benyttet derfor teknikken på en stor database med voksentale til å lage en kunstig barnedatabase. Denne brukte vi så til å lære opp en talegjenkjenner for barnestemmer, forklarer Svendsen.

– Dette har gitt en kraftig forbedring i gjenkjenning av barnetale. Feilraten er redusert med 50–70 prosent, sier han.

Krevende norsk talegjenkjenning

Ifølge Svendsen er det norske språket generelt en stor utfordring når man jobber med talegjenkjenning.

– Språk har så stor variasjon at det er vanskelig å modellere. Det norske språket som har to målformer, mange dialekter, mange tillatte ord, bøyninger, sammensatte ord og som mangler uttalenorm, er ekstra krevende, sier Svendsen.

For å demonstrere den store variasjonen i språket vårt viser han til en rekke måter folk kan si noe så enkelt som et klokkeslett på. For eksempel kan 20.05 sies som fem over åtte, tjue null fem, cirka åtte eller åtte på kvelden.

Svendsen påpeker også hvor vanskelig talegjenkjenning kan være å ta i bruk. En video av to skotter som skal ta en talestyrt engelsk heis, viser poenget på en humoristisk måte.

– Ved innføring av ny teknologi, er det viktig ikke å fjerne gammel teknologi slik som å styre en heis med knapper, selv om det kommer ny taleteknologi, understreker han.

SE OGSÅ

Du leter kanskje etter...

Saken er produsert og finansiert av Norges forskningsråd - Les mer

Data med barnestemme

Det er utfordrende å få datamaskiner til å gjenkjenne og snakke med barnestemme. Norske forskere har funnet enkle og gode løsninger på begge deler.

Saken er produsert og finansiert av Norges forskningsråd - Les mer

Om prosjektet:

SE OGSÅ

Lager dataprogram som kjenner igjen alle språk

Norske IT-forskere i verdenstoppen

Fra forsiden

Mange deler verdier i et polarisert USA

Lyser ut 120 millioner til senter for norsk språkforskning

Dårlige opplevelser i barndommen kan gjøre oss tidligere gamle

Valg i India: Populisten Modi ser ut til å vinne for tredje gang

Historiker svarer på kritikk: Derfor er han så sikker på at menneskeknokler ble brukt til å lage sukker

Forsker - arkeologi

1-2 forskere innen statistisk modellering av geologi og geofysiske data

Associate professor position in osteology

Dekan - School of Doctoral Studies

Forskningsleder for gruppen Bærekraftig hav og kyst

Seniorforsker - klimatilpasning

Doctoral Research Fellowship - National Museum of Art, Architecture and Design

Stillingsannonse hos forskning.no

Vi bruker nesten en time om dagen på å sladre om andre

Vi kan løyse plastproblema i havet

Forskere er uenige om sosiale medier er skadelige for barn

WHO om fugleinfluensa som smitter mennesker: – Enormt bekymringsfullt

Forskere i Norge skal finne svar på hvordan man beskytter hvaler fra menneskeskapte lyder

Salget av reseptfrie smertestillende falt i fjor

Spis fisk, lyder kostrådene. Men hva med skalldyr, er de nyttige på matfatet?

FHI: Kan se ut til å pågå et kikhosteutbrudd

Vind og sol sto for nesten 30 prosent av elektrisiteten i Europa i fjor

Kvinner over 65 år kan fortsette med hormonbehandling, viser ny studie

Periodisk faste: Nye studier viser potensial – og risiko

Slik kan vi fortsatt bruke dagens teknologi med mindre energi

Saken er produsert og finansiert av Norges forskningsråd - Les mer

Data med barnestemme

Det er utfordrende å få datamaskiner til å gjenkjenne og snakke med barnestemme. Norske forskere har funnet enkle og gode løsninger på begge deler.

Saken er produsert og finansiert av Norges forskningsråd - Les mer

Om prosjektet:

SE OGSÅ

Lager dataprogram som kjenner igjen alle språk

Norske IT-forskere i verdenstoppen

Fra forsiden

Mange deler verdier i et polarisert USA

Lyser ut 120 millioner til senter for norsk språkforskning

Dårlige opplevelser i barndommen kan gjøre oss tidligere gamle

Valg i India: Populisten Modi ser ut til å vinne for tredje gang

Historiker svarer på kritikk: Derfor er han så sikker på at menneske­knokler ble brukt til å lage sukker

Ledige stillinger

Forsker - arkeologi

1-2 forskere innen statistisk modellering av geologi og geofysiske data

Associate professor position in osteology

Dekan - School of Doctoral Studies

Forskningsleder for gruppen Bærekraftig hav og kyst

Seniorforsker - klimatilpasning

Doctoral Research Fellowship - National Museum of Art, Architecture and Design

Stillingsannonse hos forskning.no

Vi bruker nesten en time om dagen på å sladre om andre

Vi kan løyse plast­problema i havet

Forskere er uenige om sosiale medier er skadelige for barn

WHO om fugle­influensa som smitter mennesker: – Enormt bekymringsfullt

Forskere i Norge skal finne svar på hvordan man beskytter hvaler fra menneske­skapte lyder

Salget av reseptfrie smertestillende falt i fjor

Spis fisk, lyder kostrådene. Men hva med skalldyr, er de nyttige på matfatet?

FHI: Kan se ut til å pågå et kikhoste­utbrudd

Vind og sol sto for nesten 30 prosent av elektrisiteten i Europa i fjor

Kvinner over 65 år kan fortsette med hormon­behandling, viser ny studie

Periodisk faste: Nye studier viser potensial – og risiko

Slik kan vi fortsatt bruke dagens teknologi med mindre energi

Historiker svarer på kritikk: Derfor er han så sikker på at menneskeknokler ble brukt til å lage sukker

Vi kan løyse plastproblema i havet

WHO om fugleinfluensa som smitter mennesker: – Enormt bekymringsfullt

Forskere i Norge skal finne svar på hvordan man beskytter hvaler fra menneskeskapte lyder

FHI: Kan se ut til å pågå et kikhosteutbrudd

Kvinner over 65 år kan fortsette med hormonbehandling, viser ny studie