Jakta på den genetiske Rosetta-steinen

IT-giganten IBM bestemte seg nyleg for å byggje neste generasjons superdatamaskin for å løyse ei av "livsens gåter": den tredimensjonale strukturen til proteina. Ved Universitetet i Bergen arbeider ei gruppe bioinformatikarar med det same, om enn i ein noko mindre skala.

Denne artikkelen er over ti år gammel og kan inneholde utdatert informasjon.

"Foto: Jon Solberg"

Den planlagde IBM-maskinen BlueGene skal overgå alt som finst frå før av datamaskinar, og skal kunne utføre ein billiard (1015 = tusen billionar) rekne-operasjonar i sekundet. Den enorme kapasiteten er nødvendig fordi det er eit enormt problem som skal løysast: Forskarane vil rekne ut korleis kjeda av aminosyrer i eit protein blir folda tredimensjonalt til eit biologisk aktivt protein.

- Dette kan kanskje kallast kardinalproblemet i biologien i dag, seier førsteamanuensis Rein Aasland ved Molekylærbiologisk institutt, Universitetet i Bergen (UiB). Han er ein av initiativtakarane til UiBs satsing på bioinformatikk.

Enormt viktig

Bioinformatikk er eit forskingsområde som veks raskt, og som kjem til å få enormt mykje å seie i framtida. Mange arvelege sjukdommar heng truleg saman med endringar av forma på ulike protein, og bioinformatikken kan vere til hjelp når ein skal utvikle nye medisinar. Men det er ikkje berre lækjemiddelindustrien som satsar på bioinformatikk.

- Faget kjem til å vere svært viktig for all verksemd som har tilknyting til levande organismar. Det kan til dømes revolusjonere både landbruket og næringsmiddelindustrien. Ei djupare forståing av korleis proteina foldar seg, kan gjere det mogleg å skreddarsy enzym på ein langt meir effektiv måte enn vi kan i dag, seier Aasland.

Biokjemikaren og nobelprisvinnaren Christian Anfinsen viste tidleg på 60-talet at eit protein som var heilt utfolda, spontant kunne finne tilbake til den naturlege strukturen sin, og såleis få att den biologiske aktiviteten. Anfinsen viste dermed at informasjonen om proteinstrukturen ligg i rekkjefølgja av aminosyrene til proteina. Teoretisk sett er det kanskje mogleg å rekne ut proteinstrukturar - problemet er berre at det er ufatteleg mange måtar å folde ei aminosyrekjede på. To bindingsvinklar som kan innta nesten kva for helst slags verdiar, beskriv korleis ei aminosyre er bunden til den neste. I tillegg blir sidekjedene til aminosyrene orienterte med endå større grad av fridom.

Avgrensar problemet

Gruppa i Bergen har satsa på ein strategi der kunnskap om eigenskapane til eit protein blir brukt til å avgrense berekningsproblemet på ein slik måte at eit dataprogram og eksisterande datateknologi kan ha sjanse til å nå fram til riktige strukturar.

- Dersom vi til dømes alt veit at ei bestemt aminosyre må vere plassert på overflata til proteinet, og fortel det til dataprogrammet, kan det avgrense foldeproblemet. Ei handfull slike restriksjonar er kanskje det som skal til for å leie programmet på rett veg, seier førsteamanuensis Ingvar Eidhammer.

- Vi har valt å prøve ut strategien ved å bruke ein type “sinkfingrar” som modell. Sinkfingrar er små og strukturelt sjølvstendige delar av proteinet, og finst i mange slags protein. Sinkfingrane eignar seg godt til vårt formål, fordi dei bind to sinkatom med ein heilt bestemt geometri som avgrensar foldeproblemet.

Bergen-gruppa har valt å bruke ein såkalla genetisk algoritme som prinsipp for å føreseie strukturen. Denne algoritmen er basert på naturens eigne prinsipp for mutasjon, rekombinasjon og naturleg utval. Stipendiat Kjell Petersen står for utviklinga av programmet.

Saman med Aasland og professor Harald Stenmark ved Radiumhospitalet i Oslo har bioinformatikarane ved UiB fått støtte frå Forskingsrådet for å utvikle ein slik strategi. Aaslands og Stenmarks forskingsgrupper har spisskompetanse på kvar sin type sinkfingrar.

- Eg trur at dei samla internasjonale forskingsmiljøa ligg minst ti nobelprisar unna ei skikkeleg forståing av korleis proteina foldar seg. Dersom vi klarer å utvikle metoden vår slik vi ønskjer, trur vi at han kan kome godt med i repertoaret av program og verktøy, seier Aasland.

Motiva går att

Det viser seg at visse strukturmotiv går att i mange ulike protein. Førsteamanu- ensis Inge Jonassen ved Institutt for informatikk, UiB, har laga eit program som kan finne felles motiv i ei samling av kjende proteinstrukturar. Programmet byggjer på det eldre programmet PRATT, som Jonassen utvikla for å finne felles motiv i sjølve aminosyresekvensane til ei samling protein. PRATT er tilgjengeleg på Internett-sida til The European Bioinformatics Institute (EBI) i Cambridge, og blir brukt av forskarar i verda meir enn 2000 gonger i månaden.

Bioinformatikk er ikkje berre ei føreseiing av proteinstrukturar. Mange bioinformatikarar arbeider med problem som er knytte til tolkinga av sjølve gensekvensane. Etter kvart som stadig fleire kromosom blir fullstendig sekvensbestemte, aukar behovet for effektiv databehandling dramatisk. Samanlikning av gensekvensar frå ulike organismar har òg vorte den viktigaste metoden for å bestemme fylogenien, det vil seie slektskapen mellom dei ulike levande organismane. Dette har alt ført til at mange kapittel i livsens historiebok er skrivne om.

På den internasjonale marknaden har det lenge vore stor etterspurnad etter bioinformatikarar, men det er først no dei siste åra at det har begynt å dukke opp utdanningsprogram i faget. Ved UiB har det vore regulær bioinformatikkundervisning sidan 1995, og både ved UiB og UiO har det i haust vore arrangert nye praktiske kurs i bruk av bioinformatikk.

- For at vi skal utvikle bioinformatikken på ein fornuftig måte, er det viktig at det blir satsa skikkeleg både på forsking og utdanning, seier Eidhammer.

Powered by Labrador CMS