Denne artikkelen er produsert og finansiert av Universitetet i Agder - les mer.

Dataspela til Per-Arne Andersen krev lite reknekraft og er enklare å bruke til å trene opp algoritmar i industrielle miljø.

Gjer dataspela enklare for å trene kunstig intelligens

Per-Arne Andersen har laga enklare dataspel. Spela kan forskarar ta i bruk heilt fritt når dei skal trene opp kunstig intelligens.

– Mange dataspel er dyre og krev mykje data og energi. Det har vore behov for spel som krev lite reknekraft, for å trene opp algoritmar i industrielle miljø, seier Per-Arne Andersen, universitetslektor ved Institutt for IKT på UiA.

Nyleg disputerte han for doktorgraden med ei avhandling om korleis kunstig intelligens i dataspel kan fungere godt sjølv om dei ikkje har mykje reknekraft. Andersen har utvikla kunstig intelligens-algoritmar som kan bli brukt i system der ein må ta hyppige avgjerder. Her er dataspel mykje brukt for å trene opp kunstig intelligens.

Per-Arne Andersen disputerte nyleg frå Fakultet for teknologi og realfag ved UiA.

Lærer sjølve

Kunstig intelligens-algoritmar, også kalla oppskrifter, er sjølvlærande. Når forskaren legg inn data, lærer algoritmen seg å ta smarte val.

Forskingsområdet til Andersen blir kalla djup forsterkande læring (Deep reinforcement learning). – Målet har vore å gjere datasystema i stand til å gjennomføre avgjerder utan å gjere feil. Dette aukar og tek vare på sikkerheita i systemet, seier Andersen.

Men trening av algoritmar er datakrevjande. Også dei ulike dataspela krev mykje datakraft og energi. Ifølgje Andersen skjer mykje banebrytande forsking gjennom dataspelet Starcraft II, som treng dyre datasystem.

– Slike datasystem er ikkje allment tilgjengelege for alle forskingsinstitusjonar, seier han.

Seks spel

Andersen har derfor utvikla seks nye spelmiljø som ein kan bruke til å trene opp algoritmar. Alle er enkle å bruke og krev lite datakraft samanlikna med Starcraft. Dei er også inspirerte av ulike typar industrimiljø som til dømes bruker robotar.

– I eit par av spela kan ein til dømes trene algoritmar innan planlegging og læring ved lite informasjon. Eit anna spel er eit labyrintspel der algoritmar lærer å navigere i labyrintar ved hjelp av hukommelse. Algoritmane lærer seg kort sagt å hugse den kortaste eller smartaste vegen ut av labyrinten, seier Andersen.

Spelet «Deep Warehouse» har Andersen spesiallaga for å evaluere sikkerheita til algoritmar i automatiske lager. Her har Andersen hatt kontakt med verksemda Autostore, som tilbyr lagersystem. I desse lagera er det robotar som gjer arbeidet med å registrere ordrar, hente varer og pakke dei for sending.

Test utan å gjere skade

– Alle spela har låg vanskegrad og krev lite reknekraft. Dette gjer dei også mykje meir tilgjengelege for andre i forskingsmiljøet å bruke, seier Andersen.

I spela kan forskarane teste ut algoritmar til industrisystem utan å gjere nokon skade eller vere til risiko for menneske i den fysiske verda.

– Det er billigare å krasje robotar i eit spel enn i ein faktisk fabrikk. Slike metodar kan vere svært nyttige for industribedrifter som ønsker å feilteste maskinar og datasystem, seier Andersen.

Draumealgoritmen

Doktoravhandlinga baserer seg på ei utvikling av draumealgoritmen som Andersen laga då han arbeidde med masteroppgåva si. Algoritmen treng lite data.

– Algoritmen er blitt enda betre til å skape nye spelsituasjonar. Han utviklar eigne data undervegs. Eg kan også sjå at den nyutvikla algoritmen får med seg fleire detaljar, seier Andersen.

Draumealgoritmen, og fleire variantar av han, har Andersen testa i strategispel som går føre seg i sanntid, til dømes Starcraft II. Han og forskarkollegaer har også testa korleis algoritmen fungerer i industribedrifter der det er viktig at å oppdage feilproduksjon tidleg.

Sidan forsterkingslæring krev mykje data, blir læringa langsam og vanskeleg å gjennomføre viss du har lite datakraft tilgjengeleg.

Ser inn i framtida

– Det som er unikt med vidareføringa av draumealgoritmen, er at han lærer seg delar av spelet og ut frå det ser for seg nye måtar å spele på for å vinne. Brukt i industrien dreiar det seg om å finne nye og meir effektive måtar å gjennomføre oppgåvene på. Algoritmen klarer å sjå litt framover i tid, seier Andersen.

Andersen trur algoritmen kan vere eit godt verktøy for industribedrifter. Til dømes i bedrifter med automatiske prosessar der mange avgjerder må takast i eit bestemt tidsrom.

– Eitt døme kan vere i miljø der konsekvensen av å gjere feil er fatal. Då kan ein bruke ein slik algoritme til å trene opp dei andre algoritmane i eit draumemiljø som prøver ut ulike løysingar utan at det oppstår nokon skade om ein gjer feil, seier han.

– Draumealgoritmen er eit lite steg i riktig retning mot meir effektive og mindre datakrevjande algoritmar, men dette er ikkje slutten på denne typen forsking, seier han.

Morten Goodwin er nestleiar ved Senter for kunstig intelligens (CAIR) og var rettleiar for doktorgradsarbeidet til Andersen.

Tilgjengeleg for alle

Spela og algoritmane til Andersen ligg tilgjengelege i forskingsverktøyet CaiRL. Verktøyet er utvikla av Senter for kunstig intelligens (CAIR) ved UiA.

– Andersen har utvikla spelmiljø som forskarar over heile verda kan bruke. Alt ligg ope tilgjengeleg for alle å bruke, seier professor Morten Goodwin, nestleiar ved CAIR og rettleiar for doktorgradsavhandlinga til Andersen.

Powered by Labrador CMS