Oppdag våre andre nettsteder:

Du leter kanskje etter...

Oppdag våre andre nettsteder:

Annonse

Denne artikkelen er produsert og finansiert av Universitetet i Oslo - les mer.

Modellen har ikkje noko logisk forståing, sjølv om den skråsikkert slår fast at slik er det.

(Illustrasjonsfoto: Colourbox)

Chatroboten er dårlegare til å løysa likningar enn ein gjengs ungdomsskulelev

– Så lenge KI ikkje tenkjer logisk, er den ikkje eigentleg intelligent, seier matematikkforskar.

Torstein Helleve KOMMUNIKASJONSRÅDGIVER

Universitetet i Oslo

Publisert 09.03.2024 - 04:31

La oss seia at absolutt alle innbyggjarar i landet Alfabetia bur i enten den eine eller den andre av dei to byane i landet, Bjørgvin og Christiania, og det finst òg ein by i Alfabetia som heiter Drammen, der det bur minst ein innbyggjar. Er denne påstanden sann eller usann?

Forhåpentleg får du ikkje dette til å gå opp, og konkluderer med at påstanden må vera usann. ChatGPT hevdar derimot at han er sann, fordi Drammen er ein by i Alfabetia som verken er Bjørgvin eller Christiania.

Slik var det i alle fall for ti månadar sidan, men sidan den gong har ChatGPT lært seg riktig svar. For den som ynskjer det, vil likevel ikkje by på store vanskar å setja ChatGPT eller andre språkmodellar fast på liknande logiske feller.

– Lukkast vi fyrst i å utvikla modellar som skjønar logikk, kan vi ta med oss det til andre fag, som realfag og jus, seier Trung Tuyen Truong.

Hamnar fort på djupt vatn

For professor Trung Tuyen Truong ved Matematisk institutt, Universitetet i Oslo, er den manglande logikken derimot alvor. Dette er det fyrste steget som må overvinnast før vi kan snakka om ein intelligent kunstig intelligens.

– Språkmodellane kjenner att mønster i språk, og dermed kan dei føra ein velstrukturert samtale. Dei skjønar at det passar med ein positiv respons på «Eg har det bra i dag» og at «Eg har vondt i hovudet» er negativt, og at andre utsegner er nøytrale, seier han.

– Men dei hamnar fort på djupt vatn når dei må argumentera logisk for noko. Fyrst når dei er i stand til det, får vi det som vert kalla kunstig generell intelligens, KGI. På engelsk «artificial general intelligence», AGI.

Tolking av lovtekstar

Med såkornmidlar frå Veksthuset for verdiskaping har Truong det siste året arbeidd med å utvikla ein modell som kan hjelpa lærarar å gje gode matematikkoppgåver til elevane i grunnskulen.

– Matematikk er mitt eige fag, men hovudgrunnen er at det er det mest logiske faget samanlikna med til dømes fysikk og kjemi, seier Truong.

– Lukkast vi fyrst i å utvikla modellar som skjønar logikk, kan vi ta med oss det til andre fag. Ikkje berre til andre realfag, men òg til fag som jus, som baserer seg på logisk tolking av lovtekstar.

GPT UiO er ikkje heilt stø på fyrstegradslikningar.

Menneske heng ikkje med

Men det er eit stykke dit. Sjølv ei enkel likning som 2x+1=3 vert for vanskeleg for Universitetet i Oslo sin modell GPT UiO, som likevel klarar å løysa x+1+x=3.

– Vi ser at modellen ikkje har noko logisk forståing, sjølv om den skråsikkert slår fast at slik er det, seier Truong.

Han forklarar at i prinsippet kan alle matematiske bevis reduserast til ei logisk form. Dermed skulle ein KI med forståing for logikk kunna sjekka matematiske spørsmål.

– Problemet er at dersom slike bevis skal skrivast på ei form som ein datamaskin kan lesa, vert dei så lange og innfløkte at vi menneske ikkje heng med. Vi uttrykkjer oss i setningar i staden for, og skjønar det betre, forklarar han.

Mange milliardar løysingar

Han fortel at i ein artikkel i Nature presenterte Google nyleg modellen AlphaGeometry, som – ifylgje Google – presterer godt nok til ei topplassering i den internasjonale matematikkolympiaden, ei tevling for elevar under 20 år frå heile verda.

Han går tilbake til eksempelet med positive, negative og nøytrale utsegner.

– Då må modellen forholda seg til éin variabel med tre moglege verdiar. Men i ei geometrisk oppgåve har du kanskje femti variablar med ti moglege verdiar kvar. Talet på moglege løysingar er mange milliardar, forklarar han.

Kan gje fleire oppgåver

– Å begynna på toppen og rekna seg gjennom moglege løysingar er sjølvsagt håplaust for eit menneske. AlphaGeometry kan identifisera mønster og raskt finna fram til dei mest aktuelle løysingane veldig fort der eit menneske ville trengt mykje lenger tid. Sjølv om AlphaGeometry imponerer, har han enno ikkje noko forståing av logiske argument.

Sjølv om det opphavlege prosjektet hans er ferdig, er han open for å arbeida vidare med å bruka modellar til å skriva betre matematikkoppgåver for norske skular, om det dukkar opp nokon som er interesserte i å samarbeida..

– Ein modell vil dessutan ha tid til å gje mange fleire oppgåver enn ein lærar i løpet av ein time. Elevane kan òg få støtte til læringa si som kanskje ikkje alle kan få frå foreldra sine.

Referanse:

Trung Tuyen Truong: Forskningsprosjekt som ble avsluttet desember 2023: Harnessing AI to assist human experts in creating mathematical questions in elementary schools. Nettside på Universitetet i Oslo om prosjektet.

Artikkelen er produsert og finansiert av Universitetet i Oslo

Universitetet i Oslo er én av over 80 eiere av forskning.no. Deres kommunikasjonsansatte leverer innhold til forskning.no. Vi merker dette innholdet for å tydelig skille formidling fra uavhengig redaksjonelt stoff.
Her kan du lese mer om ordningen.

Chatroboten er dårlegare til å løysa likningar enn ein gjengs ungdoms­skulelev

– Så lenge KI ikkje tenkjer logisk, er den ikkje eigentleg intelligent, seier matematikkforskar.

Hamnar fort på djupt vatn

Tolking av lovtekstar

Menneske heng ikkje med

Mange milliardar løysingar

Kan gje fleire oppgåver

Artikkelen er produsert og finansiert av Universitetet i Oslo

Les også disse sakene fra Universitetet i Oslo:

Forskning møter barrierer: – Jeg er ganske bekymret over utviklingen

Slik kan sensorer fra smarttelefoner brukes til å ta bilde av antimaterie

Jordskjelv, snøskred og glass som knuser, har noe til felles

Digitale verktøy kan gi lærerstudenter bedre veiledning

Gråspurven er en av menneskets beste venner

KI truer demokratiet. Ekspert ber oss trekke i nødbremsen

Les flere saker laget av Universitetet i Oslo her.

forskning.no vil gjerne høre fra deg!

Fra forsiden

Slik spiser de som får en sunn alderdom, ifølge studie

– Ikke tilfeldig at så mange ytre høyre-partier har kvinnelige ledere

Eksperter er skeptiske til mulige tegn på liv i rommet

Slik takler du mørkeredsel, sceneskrekk og bekymringer

Trump pålegger universiteter mer åpenhet om pengegaver

Ledige stillinger

Forsker – datakommunikasjon

Seksjonsleder - Husdyr vilt og velferd

3 årig forskarstilling

Fagrådgiver – forskning og kunnskap

Stillingsannonse hos forskning.no

Hvorfor faller ikke rockeringen ned?

Nå er det rasjonelt å planlegge ut ifra et verstefall-scenario

Rapport viser store hull i AFP-ordningen

Så ulikt ser Norge og Sverige på «gutteproblemet»

Dette har forskerne aldri klart å filme før

Rikinger kjøper T. rex-fossiler og hindrer forskning, ifølge studie

Forskarane får perlesnor-maneta til å tenne på alle pluggar

Krisen ved amerikanske universiteter: Norge skal hente internasjonale forskere

– Det er meningsløst å snakke om en fredsprosess

Forsker tror Trump vil presse på for norsk fregattkjøp fra USA

Svensk lege kan ha funnet forklaringen på hvorfor vi mennesker er musikalske

Forskning møter barrierer: – Jeg er ganske bekymret over utviklingen

Chatroboten er dårlegare til å løysa likningar enn ein gjengs ungdomsskulelev