Med genetisk programmering skapes kraftige datamodeller ved hjelp av naturlig utvalg. Nå har en svensk forsker brukt teknikken til å finne den perfekte golfsvingen.
Denne artikkelen er over ti år gammel og kan inneholde utdatert informasjon.
I takt med kraftigere datamaskiner har datamodeller blitt stadig mer avanserte. Intelligente datamaskiner som lærer på jobben tar selv arbeidet med å finjustere datamodellen underveis, for å gjøre den mer presis og gi bedre treffsikkerhet.
Med såkalt prediktiv modellering kan man prøvekjøre forskjellige tiltak eller kampanjer uten å foreta kostbare bommerter i den virkelige verden, som for eksempel teste respons på en reklamekampanje.
Datamaskinen lærer ut fra positive og negative resultater, finner sammenhenger og forklarer hvorfor det vil bli et bestemt utfall.
En effektiv metode for å utvikle gode datamodeller er genetisk programmering (GP), som bruker Darwins prinsipp om naturlig utvalg til raskt å avle fram forbedret avkom.
I et svensk prosjekt analyseres golfsvingen fra 500 golfere for å finne ut av hva som skiller en bra golfsving fra en dårlig, så det blir mulig å automatisk foreskrive skreddersydde treningsøvelser for individuelle golfere basert på deres sving.
Det er den svenske dataforskeren Rikard König ved Högskolan i Borås som har utviklet teknikken for å tilpasse GP til prediktiv modellering.
- Siden GP er en beregningstung teknikk har den historisk hatt en relativt begrenset utbredelse. Men nå for tiden er ikke dette noe problem, i og med at datamaskinene er blitt såpass kraftige, sier König til forskning.no.
Starter med tusen tilfeldige modeller
Med genetisk programmering kombineres to lovende datamodeller for å skape en barnegenerasjon som arver de gode egenskaper fra begge foreldrene - og rendyrkes deretter videre gjennom følgende generasjoner.
Man kan begynne med tusen tilfeldige modeller og la dem konkurrere med hverandre. For hver runde beregner man hvor mye modellene bommer på kjente eksempler, der man alt vet løsningen, forkaster de dårligste, og blir sittende igjen med et naturlig utvalg som deretter kjøres i nye runder.
Til slutt ender man opp med en modell som er tilstrekkelig treffsikker.
Evolusjon er en kraftig metode
- Det fascinerende er at evolusjon er en kraftig metode hvis man vil søke gjennom alle mulige løsninger, sier König.
- Vi kan for eksempel bruke blodtester fra 100 pasienter der vi alt har foretatt diagnoser. For disse kjente eksemplene utvikler vi deretter en modell ved hjelp av GP som skal beregne så få feil som mulig.
- Om pasientgruppen er representativ, kan modellen brukes til å stille diagnoser for nye pasienter. Ofte behøver da man bare en brøkdel av de tester som ellers ville vært nødvendig for å lage datamodellen.
Sliter med komplekse modeller
Men et av problemene med GP-teknikken er at den sliter med å takle svært komplekse modeller. Siden GP søker over alle mulige løsninger, og antallet potensielle løsninger mangedobles når modellen blir mer kompleks, kan jobben fort bli uoverkommelig.
Dette problemet mener König han nå har løst med en hybridteknikk, der han kombinerer GP og tradisjonell metode.
- Løsningen er å introdusere sterke og treffsikre modeller lagd med tradisjonell prediktiv teknikk inn i en generasjon, for å styre søkingen i en lovende retning, sier han.
Det er i utgangspunktet ingen grenser for hva man kan analysere med GP-modellering. I tillegg til golfsving-analysene samarbeider Rikard König for tiden med Scania på et prosjekt der data fra titusenvis av lastebiler analyseres for å avdekke hvordan sjåfører påvirker drivstofforbruket.
- Som alle prediktive teknikker kan GP brukes i vidt forskjellige områder - så lenge det finnes tilstrekkelig med data på det man vil studere, sier König.