Noen språk pakker sammen mer informasjon i korte ord, men da må lydsystemet være komplisert, og vi bruker lenger tid på å uttale dem. (Foto: Dean Drobot / Shutterstock / NTB scanpix)

Langsomme og raske språk formidler like mye informasjon, viser ny forskning

39 bits per sekund. Det er mengden informasjon mennesker overfører når de snakker sammen, selv på forskjellige språk, ifølge en ny studie. Kan det være snakk om et universelt mønster?

Det høres ut som setningene triller ut av munnen på spanjoler i en rasende fart. Tysk kan høres traust ut i forhold.

Likevel, spanjolene får ikke sagt stort mer i løpet av ett minutt enn det tyskerne gjør. Denne balansen har vært antatt, men har ikke blitt bevist av forskere, før nå.

Italienere sa opp til ni stavelser i sekundet

Forskerne bak den nye studien har sammenlignet 17 språk fra Europa og Asia. Ti personer fra hver nasjonalitet deltok i forsøkene. Deltakerne skulle lese opp korte tekster, som for eksempel en telefonklage, en unnskyldning eller en hverdagslig fortelling.

Italiensk, japansk, serbisk, thai og tysk var blant språkene som ble undersøkt.

På forhånd gjorde forskerne en enorm jobb med å kartlegge hvor mange mulige stavelser som finnes i alle språkene, og videre, hvor mange stavelser tekstene bestod av.

En stavelse er lett å oppdage om du trommer med fingeren når du sier et ord. «Positiv», kan deles opp i tre stavelser: po - si -tiv. «Natt» har bare en stavelse.

Som ventet snakket deltakerne med forskjellig hastighet. Italienere kan si opp til ni stavelser på ett sekund, de snakker i en forrykende fart. Tyskere holder seg derimot til rundt fem eller seks stavelser i sekundet.

Regnet om til bits

Forskerne nøyde seg ikke med å se på antall stavelser i sekundet. De ville finne ut hvor mye informasjon språkrepresentantene faktisk fikk formidlet på den samme tiden.

Her blir det litt avansert. Forskerne har målt mengden informasjon i bits, slik som i datateknologi. En bit er mengden informasjon som er nødvendig for å redusere usikkerheten til halvparten.

– La meg gi et eksempel, skriver François Pellegrino, som ledet studien, på epost til forskning.no.

– Jeg kaster en mynt og ber deg gjette om den viser krone eller mynt. Hvis jeg gir deg et hint som består av en bit av informasjon, så er gåten løst, for det er bare en mulighet igjen.

Hvis du skal gjette ett av åtte tall, så vil en bit informasjon gi fire mulige svar, en ny bit informasjon vil gi to mulige svar og en siste bit vil gi bare ett mulig svar.

Et eksempel på hva deltakerne skulle si

Deltakerne i studien skulle lese opp korte tekster som var oversatt til de 17 språkene.

ENGELSK: There's a short cut over that hill to my house. Some local people say the hill is haunted. No-one likes to pass through those fields after dark. Of course, I don't believe in any of that superstitious nonsense. I just like the picturesque route through the estate.

ITALIENSK: C'e' una scorciatoia in collina per arrivare alla mia casa. Alcune persone del luogo dicono che la collina e' abitata dai fantasmi. Nessuno passa di la' dopo il tramonto. Naturalmente io non credo a queste stupide superstizioni. Mi piace molto la strada pittoresca che attraversa la mia tenuta.

FINSK: Tuon mäen yli on oikotie kotiini. Joidenkin paikallisten mukaan mäellä kummittelee. Kukaan ei halua mennä noiden peltojen läpi pimeällä. Minä en tietenkään usko mitään tuollaista taikauskoista hölynpölyä. Se on vain viehättävä reitti maatilan läpi.

– Det ligner på måten vi regner informasjonstettheten i språk. Vi beregner hvor vanskelig det er i gjennomsnitt å gjette hvilken stavelse som vil bli den neste.

Forskerne fant ut at japansk har en gjennomsnittlig informasjonstetthet på 5 bits per stavelse, det er lavt. Mens engelsk har en tetthet på omtrent 7 bits per stavelse. Vietnamesisk toppet listen med 8 bits.

Jo lettere det er å gjette hva den neste stavelsen vil bli ut ifra den forrige, jo mindre informasjon inneholder den enkelte stavelsen.

En overraskende tiltrekning mot 39 bits/ s

Forskerne fant at om de ganget antall stavelser per sekund med informasjonstettheten, så oppdaget de et merkverdig sammenfall. Alle deltakerne formidlet en mengde informasjon på omtrent 39 bits i sekundet.

Selv om vietnamesisk hadde den høyeste tettheten av informasjon, så tok de det igjen med å snakke saktere. Japanerne snakker raskere, men formidler til gjengjeld mindre informasjon per stavelse.

– Vi forventet en balanse mellom informasjonstetthet og talehastighet. Det som var mer overraskende, var at det finnes et slags «sweet spot» eller en tiltrekning mot 39 bits i sekundet, sier Pellegrino.

Forskerne tror at dette magiske tallet har å gjøre med noen kognitive og sosiale begrensninger som er innebygget i alle mennesker.

– Alle kan snakke saktere eller raskere når det er nødvendig, og vi gjør det hele tiden for å tilpasse oss bestemte situasjoner. Men i gjennomsnitt foretrekker vi å velge en informasjonsfrekvens som er rask nok til å være sosialt relevant, men ikke for rask, og dermed unngå å legge for mye kognitive ressurser i og snakke og lytte når det ikke er nødvendig.

Selv om forskerne har studert et bredt utvalg av veldig ulike språk, så er de langt unna å gripe om alle. For eksempel har forskerne ikke tatt med noen afrikanske språk.

– Det er omtrent 6000 språk i verden, kommenterer Richard Futrell, språkforsker ved Universitet i California, til nettavisen The Atlantic.

– Det gjenstår mye arbeid i en tverrspråklig sammenligning.

Tallet 39 bits i sekundet er ikke det viktigste i seg selv, sier Pellegrino.

- Det vil sannsynligvis forfines når andre språk blir lagt til, men eksistensen av en slik tiltrekning er spennende, og vil nok påvirke videre forskning. Vi kan få nye hypoteser om hvordan språk har utviklet seg, sier han.

Derfor høres noen språk raske ut

Rolf Theil er professor emeritus ved Institutt for lingvistiske og nordiske studier, UiO og han har lest den nye studien.

– Ideen om at det er en jevn og lik informasjonsoverføring mellom språk og at det må resultere i ulike talehastigheter, synes jeg virker som en veldig rimelig påstand, sier han til forskning.no.

– En gammel innsikt som de fleste lingvister har, det er at noen språk har veldig lange ord og noen har korte ord. De som har veldig lange ord, har få lyder å velge mellom.

Mens vi har 9 vokaler og 20 konsonanter på norsk. Så har de bare 5 vokaler og 8 konsonanter på hawaiisk. På norsk kan vi i tillegg klumpe sammen konsonanter etter hverandre som i «sprelskt», mens på hawaiisk så kan du ikke det. De må isteden dele opp ordet i flere stavelser.

– Når du har så få lyder å velge mellom, så må ordene bli ganske lange for at du skal kunne lage alle de ordene som språket trenger. Det er et enkelt regnestykke, sier Theil.

Hawaiisk har for eksempel adoptert det engelske ordet «christmas». Dette er «kalikimaka» på hawaiisk. Mens du kan dele det engelske ordet i to stavelser; «christ-mas», så må blir det «ka-li-ki-ma-ka» på hawaiisk.

– Mens på norsk sier vi jul, som i juuul sier, Theil og ler.

Det høres dermed ut som de snakker superfort på hawaiisk.

Store forskjeller

Engelsk har svært mange forskjellige mulige stavelser, hele 6949, mens spansk har 2778, og japansk bare 643.

– Italiensk og spansk har en noe enklere stavelsesstruktur og japansk er enda enklere. Norsk er nærmere engelsk.

Det gjør at italienerne og spanjolene må bruke flere stavelser i et ord, og det høres ut som de snakker raskere.

Det raskeste språket Theil har hørt var da han var på ferie i Kerala i Sør-India.

– Sjåføren vår snakket med kolleger på telefonen på malayalam, som er det lokale språket. Det låter helt ekstremt raskt!

– På malayalam har de bare seks vokaler og en relativt enkel stavelssestruktur. Men de får altså ikke sagt mer, de har bare veldig lange ord.

Vi må tenke mer på ordene

Grunnen til at nordmenn ikke klarer å si ting raskere, selv om vi har kortere ord enn folk på Hawaii er at de enkelte lydene er mer komplekse.

– Når man har et komplekst lydsystem med mange valgmuligheter så må hjernen planlegge mer før ordene uttales. Det gjør at man bruker lenger tid, men siden ordene er så korte så veier det opp, sier Theil.

– Slik får du da denne konsekvensen som artikkelen peker på.

Vietnamesisk er ekstremt i så måte. De har bare enstavelsesord, men de har et hav av forskjellige tonefall og mange vokaler og konsonanter å velge mellom. De utrykker sine stavelser med omhu, som gjør at språket høres temmelig langsomt ut.

Det er to flaskehalser som begrenser hvor fort vi snakker, den ene er taleren selv og den andre er tilhørerne, forklarer Theil.

Vi kan spole oss frem i et opptak og likevel få med oss det som blir sagt. Men vi hadde ikke klart å snakke like raskt.

– Her er det taleren som har den største begrensningen. Værmelderen ville ikke klare å snakke like fort som når jeg spoler over den på TV-en.

Brukte de lenger tid på å si ting før i tiden?

Mange språk har utviklet seg til å bli mer «effektive». Vi har tatt snarveier og slik har språket endret seg.

Fra år 200 til 500 e.kr så snakket folk i Norden urnordisk. Da kalte de for eksempel ravn for hrabnaʀ og Steinar for Stainawarijar.

– Fra urnordisk til norrønt så skjedde det en del sier Theil.

– Urnordisk hadde ikke så mange vokaler, bare fem. Men fra urnordisk til norrønt så fikk du i-omlyd og u-omlyd og bryting, med den konsekvensen at vokalsystemet ble mer enn fordobla. Plutselig så fikk du også mange flere konsonantgrupper.

For å sammenligne med andre språk som er nevnt, så gjorde det at man fikk en overgang fra et språk som var mer slik som japansk, med få mulige stavelser, til å bli mer slik som engelsk og norsk i dag.

– Antagelig kunne de snakke mye raskere på urnordisk enn på norrønt. Ut ifra den nye studien så vil jeg forvente det, og synes det virker som en rimelig påstand.

– Det at de trolig snakket så fort kan jo være en av grunnene til at det endte opp som det gjorde, med denne veldige forkortinga, sier Rolf Theil.

Referanse:

Christophe Coupé, Yoon Mi Oh, Dan Dediu & François Pellegrino: «Different languages, similar encoding efficiency: Comparable information rates across the human communicative niche». Science Advances, 4. september, 2019.

Powered by Labrador CMS