Oppdag våre andre nettsteder:

Du leter kanskje etter...

Oppdag våre andre nettsteder:

Annonse

Saken er produsert og finansiert av Norges forskningsråd - Les mer

Datamaskiner som skjønner bæret

I en verden hvor vi stadig må håndtere større mengder informasjon, er det godt vi har søkemotorer som kan gjenkjenne ord, telle opp og rapportere tilbake. Tenk om maskinene også kunne forstå det de leste?

Norges forskningsråd

Susanne Moen Stephansen frilansjournalist

Publisert 15.06.2007 - 05:00

Denne artikkelen er over ti år gammel og kan inneholde utdatert informasjon.

Saken er produsert og finansiert av Norges forskningsråd - Les mer

KUNSTI

KUNSTI-programmet ble avsluttet i 2006, men har nå kommet med en særutlysning på fire millioner kroner til prosjekter som kan gi konkrete resultater i løpet av 2007. Søknadsfristen var 6. juni.

www.forskningsradet.no www.kundoc.net

Da kunne de systematisert og presentert informasjon på en helt annen måte enn i dag.

Sett at du for eksempel ville skaffe deg oversikt over Valla-saken.

Med et tenkende system kunne du trykket på en knapp, og i stedet for en grumsete liste over dokumenter hvor ordet Valla er nevnt, som i dag, kunne du fått opp korte, presise sammendrag av de mest innholdstunge tekstene om saken.

Takket være forskere ved språkteknologibedriften CognIT og Seksjon for lingvistiske fag ved Universitetet i Bergen er ikke dette langt unna.

Gjennom prosjektet KunDoc under Forskningsrådets KUNSTI-program har de nemlig kommet langt på vei med å skape såkalt kunstig intelligens, som altså muliggjør smarte datamaskiner.

«United-spissen»

- Prosjektet vårt har gått ut på å finne ut om det er mulig å lære datasystemer å analysere naturspråklig tekst, slik at systemet for eksempel kan gjenkjenne og forstå såkalte koreferansekjeder i tekster, forteller prosjektleder Bernt Bremdal ved CognIT.

Koreferansekjeder er kjeder av ord og uttrykk i en tekst som refererer til det samme. For eksempel «Ole Gunnar Solskjær», «United-spissen» og «han».

En tekst som handler om Ole Gunnar Solskjær, vil ha mange slike ord i kjeden, mens selve navnet kanskje bare blir nevnt noen få ganger.

En søkemotor basert på statistiske metoder som frekvensindeksering vil ikke kunne fange opp hvilke tekster som handler spesifikt om personen man søker etter.

- Det er stort behov for smarte søkemotorer, mener Bremdal, særlig med tanke på at 80 prosent av alle søk på Internett er på navn.

Etterlikner mennesker

I KunDoc-prosjektet har forskerne sett på hvordan datamaskinelle modeller av bakgrunnskunnskap innenfor et bestemt tema, såkalte ontologier, kan etterlikne menneskelig forståelse av tekst og kontekst.

Og om slike ontologier kan læres automatisk av et datasystem.

- Kan de det, Bremdal?

- Ja, vi har utviklet en modell for automatisk læring. Vi konsentrerte oss om noen domenespesifikke tekstkorpuser innenfor sjangeren nyhetstekster, for eksempel fotballnyheter og kriminalsaker.

- På bakgrunn av disse lagde vi begrepshierarkier - ontologier - som så ble lært bort til systemet og eksperimentert med.

- Og når systemet har lært seg disse ontologiene?

- Vi har utviklet et system som gjenkjenner et dokuments kunnskapsdomene for så å aktivere den riktige ontologien for videre analyse.

- Etter det brukes det ulike teknikker for å identifisere ord som har lik referanse, eller sammenhengen mellom personer og stereotype hendelser.

For profesjonelle

CognIT har ennå litt igjen før de har lagd et så smart system som de ønsker seg, forteller Bremdal.

- Er planen å lage en ny søkemotor for Internett som skal utfordre Google?

- Nei, Google er en søkemotor for «Hvermansen» og støtter ikke systematisk innhenting og bearbeiding av data.

Arbeidet vårt i KUNSTI er rettet mot semantisk web og alle former for etterretning - det å finne og sammenstille biter av informasjon fra mange kilder som i sum gir ny innsikt og et bedre beslutningsgrunnlag.

Slik sett henvender vi oss til profesjonelle informasjonsbrukere som journalister, meglere, markedsanalytikere, shippingfolk - ja, alle som må håndtere store mengder dokumenter i jobben sin, avslutter Bremdal.

Du leter kanskje etter...

Saken er produsert og finansiert av Norges forskningsråd - Les mer

Datamaskiner som skjønner bæret

I en verden hvor vi stadig må håndtere større mengder informasjon, er det godt vi har søkemotorer som kan gjenkjenne ord, telle opp og rapportere tilbake. Tenk om maskinene også kunne forstå det de leste?

Saken er produsert og finansiert av Norges forskningsråd - Les mer

KUNSTI

«United-spissen»

Etterlikner mennesker

For profesjonelle

Fra forsiden

Hvorfor er høyrepopulistene så imot klimapolitikk?

Denne galaksen er så rar at den er med i et helt spesielt atlas

Gerd meldte seg på Holmenkollstafetten som «Øyvind». Nå er det 50 år siden kvinner fikk være med

Stoler vi nok på folk til å slippe dem inn når vi ikke er hjemme?

En landbro gjennom et tapt hav lot elefanter og aper vandre mellom Afrika og Asia

Stipendiatstillingar i profesjonsretta pedagogikk

Stipendiatstillingar i Utdanning, språk og kultur

Postdoktor - forskningsavdelingen

Stipendiat - forskningsavdelingen

Seniorforsker innen marin forskning (Forsker I eller forsker II)

Ph.D-stipendiat (Kreftavdelinga)

Studentmedarbeider

Stillingsannonse hos forskning.no

Nå mener forskere at fugler også blir venner

Vi vet ikke alltid hva slags fisk vi spiser

I disse områdene gjemmer «fjellets spøkelse» seg. Men hvor mange er det her?

Forskere ser at kjernekraft er blitt et høyre-venstre-spørsmål i norsk politikk

Økt formuesskatt vil jevne ut skatten mellom kjønn, ifølge rapport

Bakterier bryter ned Oslofjordtunnelen

– Jeg tar opp lyden av vind, vær, natur og kultur i forlatte bygninger

Fortidens skatter forsvinner inn i museenes kjellere

Har ikke vært så mye krig i verden siden 2. verdenskrig, ifølge ny rapport

NTNU-professor felt for plagiat

Det lengste pavevalget tok 1.000 dager, det korteste tok en time

Twilight-feber: Derfor besøker fans fortsatt stedene fra bøkene og filmene

Saken er produsert og finansiert av Norges forskningsråd - Les mer

Datamaskiner som skjønner bæret

I en verden hvor vi stadig må håndtere større mengder informasjon, er det godt vi har søkemotorer som kan gjenkjenne ord, telle opp og rapportere tilbake. Tenk om maskinene også kunne forstå det de leste?

Saken er produsert og finansiert av Norges forskningsråd - Les mer

KUNSTI

«United-spissen»

Etterlikner mennesker

For profesjonelle

Fra forsiden

Hvorfor er høyre­populistene så imot klimapolitikk?

Denne galaksen er så rar at den er med i et helt spesielt atlas

Gerd meldte seg på Holmenkollstafetten som «Øyvind». Nå er det 50 år siden kvinner fikk være med

Stoler vi nok på folk til å slippe dem inn når vi ikke er hjemme?

En landbro gjennom et tapt hav lot elefanter og aper vandre mellom Afrika og Asia

Ledige stillinger

Stipendiatstillingar i profesjonsretta pedagogikk

Stipendiatstillingar i Utdanning, språk og kultur

Postdoktor - forskningsavdelingen

Stipendiat - forskningsavdelingen

Seniorforsker innen marin forskning (Forsker I eller forsker II)

Ph.D-stipendiat (Kreftavdelinga)

Studentmedarbeider

Stillingsannonse hos forskning.no

Nå mener forskere at fugler også blir venner

Vi vet ikke alltid hva slags fisk vi spiser

I disse områdene gjemmer «fjellets spøkelse» seg. Men hvor mange er det her?

Forskere ser at kjernekraft er blitt et høyre-venstre-spørsmål i norsk politikk

Økt formuesskatt vil jevne ut skatten mellom kjønn, ifølge rapport

Bakterier bryter ned Oslofjordtunnelen

– Jeg tar opp lyden av vind, vær, natur og kultur i forlatte bygninger

Fortidens skatter forsvinner inn i museenes kjellere

Har ikke vært så mye krig i verden siden 2. verdenskrig, ifølge ny rapport

NTNU-professor felt for plagiat

Det lengste pavevalget tok 1.000 dager, det korteste tok en time

Twilight-feber: Derfor besøker fans fortsatt stedene fra bøkene og filmene

Hvorfor er høyrepopulistene så imot klimapolitikk?