Oppdag våre andre nettsteder:

Du leter kanskje etter...

Oppdag våre andre nettsteder:

Annonse

Datamaskiner tar til fornuften

Er det en sitron eller en tennisball? De fleste mennesker vil svare tennisball, ut fra sammenhengen. Nå har forskere tatt i bruk et mindre kjent Google-program for å lære dataprogrammer å forstå bilder utfra sammenhenger.

Arnfinn Christensen Journalist

Publisert 23.10.2007 - 05:00

Denne artikkelen er over ti år gammel og kan inneholde utdatert informasjon.

Forskere og teknologer arbeider hardt for å lære datamaskiner å forstå bilder. Mulighetene og gevinstene er mange.

En industrirobot trenger å kjenne igjen verktøy og arbeidsmaterialer. Et automatisk overvåkingssystem kan selv varsle om en ettersøkt person. Store bildearkiv kan automatisk katalogiseres.

Systemene blir bedre og bedre til å kjenne igjen elementer i bilder, og nå har forskere fra University of California i San Diego og Los Angeles lært datamaskinene å identifisere billedelementer ved å se på sammenhenger - det store bildet.

Sunn fornuft på nettet

For å se sammenhenger, tar forskerne i bruk et mindre kjent Google-program som du også kan teste ut på din egen maskin. Programmet heter Google Sets. Det virker slik at du taster inn noen få ord, for eksempel Opel, Ford og Golf. Så gjetter Google Sets på flere ord som passer i samme kategori, for eksempel Toyota, Mazda og Pegueot.

Google Sets har altså “skjønt” hva slags kategori du er ute etter, nemlig bilmerker. Dette er en simulering av sunn fornuft, en liten brikke i det store spillet som går ut på å gi datamaskiner kunstig intelligens.

Tre trinn til sikrere bildegjenkjenning

Nå kobler altså forskerne denne “sunne fornuften” til bildegjenkjenning. Først blir bildet delt opp i elementer som analyseres hver for seg. I vårt tilfelle er elementene en tennissspiller, en tennisracket og en tennisball.

'T.v: Hva er den gule flekken, en sitron eller tennisball? Midten: Først finner dataprogrammet hvert element, og prøver å tolke det for seg. T.h: Først etter å ha sett tolkningene i sammenheng finner programmet ut at sitron må være feil, og at tennisball trolig er riktig. Sammenhengen viser at personen også trolig er en tennisspiller. (Illustrasjon: forskning.no)' — "T.v: Hva er den gule flekken, en sitron eller tennisball? Midten: Først finner dataprogrammet hvert element, og prøver å tolke det for seg. T.h: Først etter å ha sett tolkningene i sammenheng finner programmet ut at sitron må være feil, og at tennisball trolig er riktig. Sammenhengen viser at personen også trolig er en tennisspiller. (Illustrasjon: forskning.no)"

Så lager dataprogrammet en liste over hva hvert av elementene i bildet kan være. Er det et godt program, så vil “person” og “tennisracket” komme øverst på lista. Men isolert sett kan tennisballen like godt være en sitron.

Det er nå den sunne fornuften kommer inn i bildet. Ved å kjøre tolkningslistene mot Google Sets, blir det klart at personen trolig er en tennisspiller og at den gule flekken er en tennisball.

Merkbar forbedring

Forskerne kunne øke påliteligheten i bildegjenkjenningen enda mer ved først å delen inn bildet i underavdelinger med sine enkeltelementer. Noen av underavdelingene var “bænkers”, og da ble disse sikre områdene brukt til å øke påliteligheten i der det var vanskeligere å gjenkjenne noe.

I de to bildesettene som forskerne analyserte, ble resultatene merkbart forbedret ved å analysere sammenhengen med Google Sets. I ett tilfelle var forbedringen ti prosent, i et annet tilfelle to prosent.

Hva er over og hva er under?

Forskerne planlegger nå neste skritt i bruk av sammenhenger for å tolke bilder. De vil la datamaskinene analysere hvor bildeelementene er plassert i forhold til hverandre. Hva er innerst og hva er ytterst? Hva er under og hva er oppå?

For eksempel vil et menneske oppå et dyr tyde på at dyret snarere er en hest enn en hund.

Men hva ville bildegjenkjenningsprogrammet gjøre med et bilde fra det norske eventyret om pannekaka og grisen?

Referanser

Object in Context. (Andrew Rabinovich, Garolina Galleguillos, Eric Wiewiora and Serge Belonguie, Department of Computer Science and Enginering, UCSD Jacobs School of Engineering. Andrea Vedaldi, Demartment of Computer Science, UCLA)

Pressemelding fra University of California, San Diego

Google Sets

teknologi data

Du leter kanskje etter...

Datamaskiner tar til fornuften

Er det en sitron eller en tennisball? De fleste mennesker vil svare tennisball, ut fra sammenhengen. Nå har forskere tatt i bruk et mindre kjent Google-program for å lære dataprogrammer å forstå bilder utfra sammenhenger.

Sunn fornuft på nettet

Merkbar forbedring

Hva er over og hva er under?

Referanser

Fra forsiden

Hvor lenge bør du sove for å ha god helse? Det kommer an på hvilket land du bor i

Elgens egne bilder avslører hva de driver med

Akademia kuttet konsulentbruken med 20 prosent

Er det innafor med rosa skjorte til bunaden?

Foreldre til barn med skolevegring blir selv syke

Stipendiatstillingar i profesjonsretta pedagogikk

Stipendiatstillingar i Utdanning, språk og kultur

Postdoktor - forskningsavdelingen

Stipendiat - forskningsavdelingen

Seniorforsker innen marin forskning (Forsker I eller forsker II)

Ph.D-stipendiat (Kreftavdelinga)

Studentmedarbeider

Stillingsannonse hos forskning.no

Mann fikk 200 slangebitt. Nå kan blodet hans redde liv, håper forskere

Vi må snakke om rasisme med utestemme

Vaksinen mot helvetesild beskytter også mot hjertesykdom

Hvorfor er høyrepopulistene så imot klimapolitikk?

Denne galaksen er så rar at den er med i et helt spesielt atlas

Gerd meldte seg på Holmenkollstafetten som «Øyvind». Nå er det 50 år siden kvinner fikk være med

Oppsiktsvekkende resultater om panikkangst: Behandlingen har god effekt over lang tid

En landbro gjennom et tapt hav lot elefanter og aper vandre mellom Afrika og Asia

I disse områdene gjemmer «fjellets spøkelse» seg. Men hvor mange er det her?

Forskere ser at kjernekraft er blitt et høyre-venstre-spørsmål i norsk politikk

Økt formuesskatt vil jevne ut skatten mellom kjønn, ifølge rapport

Umiddelbar handling er viktig for vellykket marin restaurering

Datamaskiner tar til fornuften

Er det en sitron eller en tennisball? De fleste mennesker vil svare tennisball, ut fra sammenhengen. Nå har forskere tatt i bruk et mindre kjent Google-program for å lære dataprogrammer å forstå bilder utfra sammenhenger.

Sunn fornuft på nettet

Merkbar forbedring

Hva er over og hva er under?

Referanser

Fra forsiden

Hvor lenge bør du sove for å ha god helse? Det kommer an på hvilket land du bor i

Elgens egne bilder avslører hva de driver med

Akademia kuttet konsulentbruken med 20 prosent

Er det innafor med rosa skjorte til bunaden?

Foreldre til barn med skolevegring blir selv syke

Ledige stillinger

Stipendiatstillingar i profesjonsretta pedagogikk

Stipendiatstillingar i Utdanning, språk og kultur

Postdoktor - forskningsavdelingen

Stipendiat - forskningsavdelingen

Seniorforsker innen marin forskning (Forsker I eller forsker II)

Ph.D-stipendiat (Kreftavdelinga)

Studentmedarbeider

Stillingsannonse hos forskning.no

Mann fikk 200 slangebitt. Nå kan blodet hans redde liv, håper forskere

Vi må snakke om rasisme med utestemme

Vaksinen mot helvetesild beskytter også mot hjertesykdom

Hvorfor er høyre­populistene så imot klimapolitikk?

Denne galaksen er så rar at den er med i et helt spesielt atlas

Gerd meldte seg på Holmenkollstafetten som «Øyvind». Nå er det 50 år siden kvinner fikk være med

Oppsiktsvekkende resultater om panikkangst: Behandlingen har god effekt over lang tid

En landbro gjennom et tapt hav lot elefanter og aper vandre mellom Afrika og Asia

I disse områdene gjemmer «fjellets spøkelse» seg. Men hvor mange er det her?

Forskere ser at kjernekraft er blitt et høyre-venstre-spørsmål i norsk politikk

Økt formuesskatt vil jevne ut skatten mellom kjønn, ifølge rapport

Umiddelbar handling er viktig for vellykket marin restaurering

Hvorfor er høyrepopulistene så imot klimapolitikk?