Ordknuserne

De scanner Shakespeare, indekserer ordene og knar kunsten inn i statistiske grafer. Hva kommer ut?

Publisert
Michael Correll (Foto: Arnfinn Christensen)
Michael Correll (Foto: Arnfinn Christensen)

EuroVis 2011

EuroVis 2011 er den trettende årlige symposiet om visualisering, det vil si framstilling av sammenhenger i komplekse data med grafiske figurer.

Symposiet organiseres av European Association for Computer Graphics (Eurographics), og Institute of Electrical and Electronics Engineers (IEEE).

Arrangør i år er Universitet i Bergen, der symposiet holdes fra 1. til 3. juni.

- Vi unngår meningsinnholdet til tekstene, sier Michael Correll fra University of Wisconsin-Madison til forskning.no.

Han har ledet utviklingen av to dataprogrammer som ikke knuser tall, men ord. Programmene gjør det mulig for litteraturforskere å scanne enorme tekstmengder og se mønstre - men altså ikke mening i seg selv.

Ord skaper mening

- I vår sjargong kalles det avstandslesning (distanced reading), forklarer han.

- Du vil ha avstand til teksten. Hvis du er opphengt i meningsinnholdet, så går du glipp av hvordan forfatteren bruker ord. Og vi er mest opptatt av hvordan ord skaper mening, snarere enn meningen i seg selv, sier Correll.

Fagområdet kalles retorisk analyse. Problemet for fagfolkene har vært å gå fra nærlesning av spesielt interessante avsnitt til hele tekstvolumer.

Å gjøre det uten hjelp av datamaskiner, krever et enormt arbeide.

Zoomer inn

Ett av vinduene i CorpusSeparator (Figur: Michael Correll)
Ett av vinduene i CorpusSeparator (Figur: Michael Correll)

Tidligere programvare har riktignok hjulpet forskerne enten i nærfeltet, eller for å danne det store bildet av hele bøker eller boksamlinger.

Men programvaren som Correll og kollegene har utviklet, kombinerer de to synsvinklene. Den gjør det mulig å gå fra helhet til deler av teksten.

For å få til en slik innzooming, består programvaren av to enheter: CorpusSeparator for totalbildet og Text Viewer for nærbildet av de enkelte ord og avsnitt.

Forskerne kan se mønstere som fargede punkter i et diagram, og gå direkte fra disse mønstrene ned i overrraskende egenskaper i den konkrete teksten.

Så hva har de funnet?

Striglet Shakespeare

Ett eksempel er at forskerne har avslørt hvordan skuespillene til Shakespeare ble modernisert på 1700-tallet. Da kom de første ordbøkene, og den frodige rettskrivingen fra renessansen ble striglet for den nye opplysningstid.

Ved å gi tekstene en omvendt språkvask og tilbakeføre dem nærmere originalen, ble det mulig for forskerne å kjøre den gjennom analyseprogrammene og se nye, spennende mønstre.

Blant annet fant de ut rollefigurene påvirket måten Shakespeare skrev på. Når de skildret andre menneskers sosiale status, endret han også stil.

- Dette er en toveis prosess. Måten du skriver teksten på vil påvirke meningen folk får ut av dem. Men meningen du vil skape, påvirker også måten du skriver på, kommenterer Correll.

Komedisk tragedie

Ett av vinduene i TextViewer. Teksten som programmet vil framheve, utvider seg. (Figur: Michael Correll)
Ett av vinduene i TextViewer. Teksten som programmet vil framheve, utvider seg. (Figur: Michael Correll)

Et annet eksempel er at Shakespeares tragedie Othello overraskende har elementer av komedie i seg, fortalte Correll under foredraget sitt her på EuroVis 2011.

Og da mener han ikke festlige vitser på gravens rand, men skrivestil.

Igjen: Retorisk analyse vil ikke vite noe om meningen, men om hvordan ordene skaper meningen. Eller mer generelt: Hvordan symboler virker på mennesker.

Kom sammen, litterater

Og de fargerike symbolene i dataprogrammene som Correll og kollegene hans har utviklet, har sin effekt på litteraturforskerne. I ett tilfelle fikk de se den grafiske framstillingen av en gruppe skuespill som hovedsakelig var skrevet av Shakespeare.

- Når en gruppe av 30 eksperter på renessansedrama fikk se bildet, begynte de straks å lage hypoteser om den spesielle Shakespeare-stilen.

- Slik kan literær analyse, som før ble gjort av den enkelte i ensomhet, bli gjort kollektivt, slik at kunnskapsområdet til gruppen blir mangfoldiggjort, skriver Correll i sin artikkel.

Penselstrøk gir stil

Han håper at denne typen analyse kan utvikles til andre områder enn litteratur.

- Det er for eksempel allerede nå ganske gode teknikker for å se på slike ting som penselstrøk i malerier for å bestemme malerstil, forteller han.

- Så det ville jo være fint hvis du fikk analysert hvilke deler av maleriet som kan tolkes abstrakt, og hvilke deler som er impresjonistiske.

Referanse:

M. Correll, M. Witmore, M. Gleicher, Exploring Collections of Tagged Text for Literary Scholarship, Eurographics / IEEE Symposium on Visualization 2011 (EuroVis 2011) Volume 30 (2011), Number 3, DOI: 10.1111/j.1467-8659.2011.01922.x