Gullas forskning på smarte søkemotorer i ISA-prosjektet ble støttet av VERDIKT–programmet i Forskningsrådet i perioden 2007–2010.
De mest populære søkemotorene i dag gir ofte en lang rekke irrelevante treff. Dette skjer fordi søkemotoren kun beregner treff etter ordfrekvens og statistikk.
Det vil si at den tar hensyn til hvilke bokstaver du har brukt i hvilken rekkefølge, men uten å forstå hva søkeordene betyr, altså hva du egentlig er på jakt etter.
– Dagens søkemotorer matcher etter frekvens og statistikk. Vi jobber med søkemotorer som også tar semantikk og innhold med i beregningen, forteller Jon Atle Gulla, professor ved NTNU.
Sammen med kollegaene utvikler han en ny teknologi som i langt større grad vil gi deg informasjonen du faktisk leter etter.
Dette har de klart ved å gi maskinene evnen til å skjønne betydningen av ord og utrykk. Dermed kan maskinen ta hensyn til hva det er sannsynlig at du leter etter når du forer den med ulike søkeord.
Utvikler leksikon
Forskerne utvikler et leksikon for begreper som gir brukerne og maskinene felles forståelse for ord, samt en søkestrategi som gjør at man kan dra mest mulig nytte av teknologien.
– Vi gir maskinene de samme forutsetningene for å forstå innholdet i et ord som det brukerne har. Maskinene tilpasser seg dermed hvordan menneskene bruker språket, og du vil merke at søkene dine vil ha større presisjon og mer relevans, forklarer Gulla.
Fra ord til innhold
Gulla trekker fram Europas største telekommunikasjonsselskap, Deutsche Telecoms online filmbutikk, som eksempel på et selskap som vil ta i bruk teknologien i nærmeste fremtid.
– Noen ganger vet du kanskje ikke hvilken film du vil ha, men skriver inn navnet på en skuespiller. Da vil systemet kunne komme med forslag til andre lignende skuespillere som du kanskje vil like.
– Det kan også forstå hva slags type film du er ute etter og komme med gode forslag til det, sier Gulla.
Dette er forskjellig fra eksisterende tjenester som Amazon blant annet fordi innhold nå vil bli tatt med i betraktningen.
– Vi matcher ikke ord mot ord, men matcher innhold mot innhold. Hvis du leter etter en bok, kan vi med vår teknologi for eksempel si: Vi fant kanskje ikke akkurat den du ville ha om semantisk web, men vi fant en om ontologi, og dette er temaer som typisk er relaterte.
– Vi er i stand til å si at du også burde kjøpe noe innen de og de andre temaene, som innholdsmessig er relatert til disse bøkene, utdyper Gulla.
Best på helse og olje
Han påpeker at teknologien for øyeblikket egner seg best i avgrensede domener, for eksempel innen medisin, byggeindustrien eller oljebransjen.
Annonse
– Teknologien egner seg ikke nødvendigvis ute på webben fordi det er vanskelig å lage et leksikon for alle ord. Men i domenespesifikke miljøer vil dette være til stor hjelp. Ifølge Gulla har Norge kommet langt i implementeringen av denne teknologien i visse sektorer.
– Vi er blant de første i verden til å ta i bruk denne teknologien innen medisin og petroleum, påpeker han.