Nettbibliotek med 1,5 mill. bøker

Et internasjonalt prosjekt har skannet en stor mengde bøker og gjort dem tilgjengelige på nettet.

Publisert

Det er første gang siden prosjektet ble lansert i 2002, at alle bøkene er tilgjengelige gjennom én nettportal, kalt The Universal Digital Library: Million Book Collection.

- Hvem som helst som kan komme seg på Internett har nå tilgang til en samling bøker på størrelse med et stort universitetsbibliotek, sier Raj Reddy.

Han er professor i informatikk og robotteknologi ved Carnegie Mellon University.

Samarbeid

Reddy har stått i spissen for prosjektet, som ikke er det eneste i sitt slag.

Både Google, Microsoft og Internet Archive har lansert store digitaliseringsprosjekter. Million Book Collection er imidlertid det største universitetsbaserte digitale biblioteket med fritt tilgjengelige bøker.

Prosjektet ledes i felleskap av Carnegie Mellon University i USA, Zhejiang University i Kina, Indian Institute of Science i India, og Biblioteket i Alexandria i Egypt.

- Dette tar oss nærmere idealet for Universal Library: å gjøre alle publiserte verker tilgjengelige for hvem som helst, når som helst, på et hvilket som helst språk, sier Reddy i en pressemelding.

- De økonomiske barrierene for distribusjon av kunnskap er i ferd med å falle, mener Reddy.

Mange gamle bøker

Minst halvparten av bøkene i nettbiblioteket er utenfor opphavsrett fordi de ble publisert før 1923, eller fordi forfatter eller forlag har gitt sin tillatelse til at boka legges på nett.

Samlingen inkluderer også mange sjeldne bøker, og bøker med ukjent opphav. Mer enn 20 forskjellige språk er representert blant de 1,5 millioner bøkene.

Til sammen utgjør basen mindre enn én prosent av verdens bøker.

Søkbart

Nærmere én million av bøkene i nettbiblioteket er på kinesisk. Nærmere 400 000 er på arabisk, mens litt over 350 000 er på engelsk.

Mange av bøkene, spesielt de på kinesisk og engelsk, har også blitt digitalisert. Det vil si at teksten er konvertert til datalesbar tekst, ved hjelp av optisk programvare som gjenkjenner bokstaver.

Slik blir disse bøkene også gjort søkbare, og kan også etter hvert reformateres slik at de blir tilgjengelige for håndholdte datamaskiner (PDAer) eller andre duppeditter.

Norske bøker

Million Book Collection inneholder dessuten per i dag sju norske bøker. Du kan for eksempel finne Henrik Ibsens Peer Gynt: Et Dramatisk Digt, i en utgave fra 1906, publisert av Gyldendalske boghandel. Verket er skannet (i Egypt), digitalisert og søkbart.

I tillegg kan du finne Bjørnstjerne Bjørnsons samlede verker i en fembinds utgave fra 1932, utgitt av Gyldendal Norsk Forlag (og skannet i India). Siden det opphavsrett fortsatt gjelder for disse bøkene, er under 15 prosent av verkene lagt ut.

Den skannede versjonen av Bjørnsons verker er lett leselig, men konverteringen til html har nok ikke gått helt smertefritt: (BJ0RNSTJERNE BJ0RNSON SAHLBDB V.BRKBR HUNDREARSUTGAVB).

Opphavsrett

Selv om Universal Library har et langsiktig mål om å gjøre bøker, kunstverk og annet publisert materiale (for eksempel aviser og taler) tilgjengelig på Internett gratis, er rundt halvparten av de 1,5 millioner bøkene omfattet av opphavsrett i dag.

Inntil man har dokumentert tillatelse fra opphavsrettsinnehaverne, eller opphavsrettslovverket endres, kan man bare gjengi rundt 10 prosent av hver bok på nettet, uten å ta betalt.

Det betyr altså at mange av bøkene er representert i samlingen med kun en mindre del av teksten.

7 000 bøker om dagen

Mesteparten av skanningen, digitaliseringen og katalogiseringen har foregått i Kina (1,1 millioner bøker) og India (360 000 bøker). Biblioteket i Alexandria i Egypt har nylig blitt med i prosjektet.

Ifølge pressemeldingen skannes nå rundt 7 000 bøker om dagen av mer enn 1 000 arbeidere over hele verden.

- Vi setter stor pris på deltakelsen til Biblioteket i Alexandria, sier Michael Samos, professor i informatikk og opphavsrettsadvokat ved Carnegie Mellon University.

- Lærde verden over er lei for ødeleggelsen av Biblioteket i Alexandria på forskjellige tidspunkt i historien, og vi er villige til å gå langt for å sørge for at ingen slik ødeleggelse vil bli mulig i fremtiden, sier Samos.

Bevaring

Kinas prosjektleder, Pan Yunhe, sier at beskyttelse og bevaring av tekster er et hovedmål.

- Papir blir gammelt og sprøtt, så bøker blir raskt så skjøre at ingen kan lese dem uten å skade dem, sier han.

- Kunstverk falmer. Men så fort vi har digitalisert tekster og illustrasjoner, kan vi holde dem i sirkulasjon i det uendelige. Ved å lagre dem på flere steder, kan vi minimere risikoen for at de blir ødelagt, slik det skjedde i Alexandria, sier Yunhe.

Tilgjengelig kultur

N. Balakrishnan representerer den indiske parten i prosjektet.

- Denne samlingen av bøker på flere språk åpner muligheter uten sidestykke for å bringe indisk kulturmateriale til alle, og gir en stor mengde muligheter innen språkforskning, sier han.

Ismail Serageldin er direktør for Biblioteket i Alexandria, og mener digitale biblioteker utgjør en essensiell del av fremtiden i utviklingsland.

- Dette gjør at vi må nærme oss forhold som styrer opphavsrett, digital arkivering og vitenskapelige databaser med det for øye å skape et system med to lag, som muliggjør tilgang fra utviklingsland for en symbolsk sum, eller gratis, sier han.

Lenke:

The Universal Digital Library: Million Book Collection