Har du noen gang tenkt tanken «hva hvis jeg kunne snakke med hunden min»? Ved bruk av kunstig intelligens er vi kanskje nærmere enn vi tror.(Illustrasjonsfoto: Colin Braley/NTB)
Kan KI lære oss å snakke med dyr?
Mennesker har alltid drømt om å snakke med dyr. Med kunstig intelligens er vi nærmere enn noen gang før, så når kommer vi til å klare det?
SilasMortensenJournalist videnskab.dk
Publisert
Mennesker som kan snakke med dyr, dukker opp i alt fra Narnia-fortellingene og trollmannen Radagast i «Ringenes herre», til superhelten Aquaman og 80-tallsfilmen «Beastmaster» og Harry Potter.
Til og med i verdens kanskje eldste nedskrevne fortelling, Gilgamesh-kvadet fra Mesopotamia (nåtidas Irak), har villmannen Enkidu denne evnen.
Og så har vi de britiske barnebøkene om Dr. Dolittle: En landsbylege som bytter ut menneskepasientene sine med dyr etter at han lærer å snakke med dem.
De kaller den tenkte KI-en for CatGPT – «en maskin som lar oss snakke med våre katter». Forskerne ser for seg at CatGPT baserer seg på kattens vokaliseringer, altså lydene den lager.
– KI har revolusjonert vår evne til å kommunisere ved hjelp av datamaskiner, og forskere prøver nå å bruke den til å kommunisere med dyr. Jeg er veldig nysgjerrig på hvor langt vi kan komme, skriver Yossi Yovel i en e-post til den danske forskningsavisen Videnskab.dk. Han er en av forfatterne bak The Doctor Dolittle Challenge.
En premie på 10 millioner dollar, eller godt over 111 millioner norske kroner, er utlovet til den forskergruppa som klarer å snakke med dyr.
Betyr det at vi allerede kan kommunisere med dyr? Ikke ifølge forfatterne bak Dolittle-utfordringen.
De legger vekt på at kommunikasjonen skal foregå med dyrenes egne, naturlige signaler og ikke gjennom et språk vi har lært dem. Det er her KI – særlig den nyeste formen, generativ KI – og såkalte Large Language Models (LLM) kommer inn i bildet.
Miniordbok om KI-teknologier
Generativ KI
Generativ KI betyr at kunstig intelligens kan skape nytt innhold. ChatGPT kan for eksempel produsere store mengder tekst i hele setninger. Andre generative KI-er kan lage bilder, video, musikk eller hørbar tale basert på et såkalt prompt (et skriftlig opplegg).
Maskinlæring (ML)
Felles for alle typer generativ KI er at de må «trenes» med et datasett som de kan generere nytt innhold fra. En KI-bildegenerator må se mange bilder for selv å kunne lage nye. En KI-lydgenerator må høre mange opptak for å lage lyd. Denne prosessen, hvor maskinen lærer å generere sitt output ved å få mye input, kalles maskinlæring.
Store språkmodeller (LLM)
Når en KI har med språk å gjøre, kalles den mengden kunnskap som maskinen tilegner seg fra datasettet for «en stor språkmodell»: Ved å ta inn store mengder språklige data lærer maskinen å avkode språket, slik at den kan generere nytt innhold (output).
Inspirert av Turing-testen utfordres forskere til å lage en metode for å kommunisere med ikke-menneskelige organismer. Metoden skal være ikke-invasiv (de skal ikke lære dyrene språket vårt), fungere i ulike kontekster, bruke organismens eget «språk» og vise en målbar respons.
Turingtesten ble formulert av matematikeren Alan Turing i 1950 for å sannsynliggjøre at det er mulig å konstruere maskiner som kan imitere menneskelig tenkeevne, ifølge Store norske leksikon.
Turings tankeeksperiment har vært et viktig redskap i utviklingen av datamaskiner og kunstig intelligens.
The Coller-Dolittle Prize skal gå over flere år, med en årlig premie på 100.000 dollar som første gang blir utdelt i 2024. Hovedpremien er på 500.000 dollar eller en investeringssum på 10 millioner dollar.
Ved å samle inn store datasett med dyrelyder, la en KI-algoritme finne mønstre i dem og prøve å forstå lydenes betydning, kan vi allerede etterligne dyrs lyder godt nok til å bestå en slags «omvendt Turing-test». Turing-testen er egentlig et tankeeksperiment som er brukt til å avgjøre om det er mulig å skille mellom et menneske og en datamaskin som viser intelligent atferd. I tilfellet med dyr vil det si at dyrene reagerer på KI-genererte lyder som om de hører et annet dyr og ikke en maskin.
Vi kan ta opp og imitere dyrenes signaler og lage nye generative KI-modeller basert på dem:
– Disse modellene har evnen til å lære statistisk fra eksemplene de mates med og generere nye eksempler. Akkurat som de kan generere et nytt Van Gogh-lignende bilde, kan de også generere nye vokaliseringer, skriver forskerne i sitt essay.
Har dyr et språk?
De siste årene har det kommet en rekke forskningsartikler hvor KI og maskinlæring har blitt brukt til å finne mønstre og nyanser i dyrelyder som det menneskelige øret ikke kan høre. Slik som at dyrelyder kan være spesifikke både for individer og grupper og til og med ha lokale «aksenter».
Annonse
Dolittle-forfatterne legger lista høyere: De krever at vi forstår hva dyrelydene betyr og finner hva som er riktig respons, ved å bruke lydene i riktig kontekst. Dette krever store mengder data.
Dyrs ordforråd er fysisk begrenset, og menneskets evne til å uttale mange forskjellige lyder er ganske spesiell. Så selv om dyr kan lære å forstå kommandoer og utføre dem, kan de med få unntak ikke gjengi dem.
Hunder kan i gjennomsnitt reagere på 89 ord. Med intens trening kan de lære å respondere på opptil 200 ord. Og i ett tilfelle har en border collie klart å skille mellom navnene på over tusen objekter. Men de kan altså ikke gjengi lyden av ordene selv.
– De fleste hunder trenger bare å høre ord et par ganger før de kan identifisere «det er det han mener med den røde bamsen», for eksempel. Hunden hører en lyd fra oss og forbinder objektet med lyden. Men den har ingen egen lyd for disse tingene som den kan si høyt, sier Mads Frost Bertelsen, veterinær, adjungert professor og zoologisk direktør ved Københavns Zoologiske Have.
Forstår ikke det de sier
Kommunikasjon må ikke være ord
At dyr kan kommunisere med hverandre, er ikke det samme som at de har et språk.
Kommunikasjon er nemlig bare å gi videre informasjon. Kommunikasjonen består av tegn som kan overføre informasjon (for eksempel kan en lukt varsle om mat, sykdom eller rovdyr), men som ikke inneholder budskap som både avsender og mottaker har en felles forståelse av.
Det gjør derimot språk: Det består av signaler – et ordforråd – som i motsetning til tegn har en felles mening. Denne meningen kalles semantikk: Når en baby for eksempel lærer å si «mam» fordi den vil ha mat, kan vi si at den har en semantisk forståelse av signalet. Når den derimot hyler eller gråter fordi den er sulten, kommuniserer den uten semantisk forståelse.
Språk forutsetter at semantikken kan varieres gjennom syntaks: Ordene må kunne blandes og endre rekkefølge for å skape nye budskap. Setningene «du er der» og «er du der?» består av de samme ordene (signalene), men forskjellen i rekkefølge gir to forskjellige betydninger.
Andre dyr, først og fremst fugler, kan lage mange forskjellige lyder. Noen kan til og med etterligne lyder de hører – også mennesketale – så nøyaktig at vi ikke kan høre forskjell. Papegøyer kan lære både ord og hele setninger. De ser likevel ikke ut til å forstå hva lydene betyr:
– Det er en del av mange fuglers naturlige sangrepertoar å etterligne lydene fra andre dyr. Men en papegøye som etterligner menneskelige ord, vet ikke hva de betyr eller at lyden av for eksempel ordet «rampegutt» refererer til dem selv. De lærer til gjengjeld ofte raskt at et bestemt svar på et gitt spørsmål utløser en godbit eller reaksjon, sier Bertelsen.
Han påpeker at vi må være forsiktige med å se på dyrs kommunikasjon som om de var mennesker.
– For de aller fleste dyr er lydkommunikasjon en veldig liten del av deres spekter. Hunder trenger ikke å si noe: De kan stå og bevege seg litt rundt hverandre og snuse uten å trenge å lage noen lyder overhodet.
Kan dyr forstå humor og beskrive følelser?
Annonse
Det er bevist at dyr har signaler eller navn på hverandre, mat, fysiske ting og trusler. Disse signalene brukes til å advare hverandre om for eksempel rovdyr.
Ellers finnes det få eksempler, spesielt på signaler med abstrakt betydning, slik som følelser og humor:
– Dyr har et større register av følelser og sinnstilstander enn det vi kanskje tidligere har anerkjent. Det tror jeg det ikke er noen tvil om. Men det er vanskelig å forestille seg at vi kan spørre et dyr «hvordan har du det?» og få svar om at «de synes det er litt tungt i dag», sier Tobias Wang. Han er biolog og professor i zoofysiologi ved Aarhus Universitet.
Forskerne bak Dr. Dolittle-utfordringen påpeker at en stor del av dyrs kommunikasjon dreier seg om å vise aggresjon og at menneskespråkets evne til å beskrive abstrakte fenomener utenfor vår sansning helt unik. Som de skriver:
«… hvis katter ikke snakker om følelsene sine med hverandre eller synes at ordspill er morsomme, vil vi trolig aldri kunne spørre dem hva de føler eller forklare at ChatGPT allerede betyr KatGPT på fransk (eller at det kanskje er morsomt).» («Chat» er det franske ordet for «katt», red.anm.)
Så vil vi kunne ha en samtale med en hund?
Så kanskje er det ikke teknologien som står i veien for å snakke med dyr.
– Jeg tror helt fundamentalt at hvis dyr har et språk som bare har et begrenset antall elementer, kan vi godt avkode det. Vi kan forstå disse signalene og tyde dyrenes språk. Men å gå derfra til å kunne si noe til dem som de forstår innholdet i og så snakke med dem … det tror jeg er en annen sak, konkluderer Bertelsen.
– En samtale krever at vi svarer hverandre på en meningsfylt måte. Jeg vet ikke om vi når dit. Vi vet jo egentlig ikke om det er det dyrene gjør: Har de egentlige samtaler, eller lager de bare lyder for å kommunisere utsagn til hverandre? Det er det vanskelig å bli klok på, sier Wang.