Prirodno matematički fakultet univerziteta u Nišu Departman za biologiju sa ekologijom dr Jelka Crnobrnja Isailović, redovni profesor Teorija evolucije - autorizovana skripta EVOLUCIJA DNK SEKVENCI, GENA I PROTEINA Uticaj molekularne biologije na evolucionu biologiju izazvao je značajne konceptualne i metodološke promene. Mapiranje kompletnog genoma vrsta je postalo rutina. Između ostalih, do sada su u potpunosti mapirani genomi preko 700 vrsta mikroorganizama, pirinča, morskog ježa, riba, vodozemaca, ptica i nekoliko vrsta sisara,. To je omogućilo istovremeno analiziranje populacione dinamike nekoliko stotina gena, njihovih međusobnih interakcija i mehanizma uticaja tih interakcija na njihovu evolucionu sudbinu. Potpuno sekvencioniranje genoma počelo je sredinom 80-tih godina XX veka. Tehnologija DNK sekvencioniranja na velikoj skali je jedna od oblasti koje najbrže napreduju i nije više toliko skupa. Otkriće ogromne raznovrsnosti genskih struktura, obrazaca duplikacije, spajanja gena i regulatornih interakcija dovelo je do promene definicije gena. Umesto obrasca na osnovu koga se vrši sinteza aminokiselinskog lanca, neki naučnici gen predstavljaju kao računarski modul. Sukobi interpretacija svejedno dovode do zajedničkog stanovišta da je genom veoma dinamičan i da se dosadašnje kategorije kao gen, egzon, protein i RNK transkript sve više prepliću. Molekularna biologija pre svega proučava strukturu DNK, RNK i proteina, kao i procese replikacije, transkripcije, translacije i regulacije nivoa genskih proizvoda. Evoluciona biologija koristi informacije o molekulskoj strukturi i procesima, kao i o procesima i tehnikama koje se koriste za molekularna istraživanja. Uporedna genomika predstavlja uporedno proučavanje čitavih genoma i počela je da se primenjuje prvo na jednostavnijim, a onda i na kompleksnijim, eukariotskim, genomima. Smatralo se da razlike u vremenu otključavanja i zaključavanja i poziciji genske ekspresije više doprinose morfološkoj različitosti vrsta nego pojedinačne substitucije unutar gena koji kodiraju proteine, naročito među bliskim vrstama kao što su ljudi i šimpanze. Ova hipoteza nastala je na temelju činjenice da se proteini čoveka i šimpanze razlikuju samo u 1% nukleotidnih sekvenci, dok su fenotipske razlike na nivou morfoloških osobina i ponašanja
velike. Proučavanje evolucije genske ekspresije omogućilo je otkriće, na primer, procesa RNK editovanja, putem koga sekvenca transkripta mitohondrijske RNK može da se izmeni i na taj način nadoknadi različite genske defekte. RAZNOVRSNOST I EVOLUCIJA GENOMA Majkl Linč i Džon Koneri su 2003 godine ukazali da su mnoge karakteristike genoma u početku imale veoma malo povoljnih efekata po adaptivnu vrednost organizma. Introni, transpozonski elementi, veliki nizovi nekodirajuće DNK verovatno su preovladavali kod vrsta koje su imale male efektivne veličine populacija. Virusi i bakterije odlikuju se veoma velikim populacijama što ubrzava favorizovanje povoljnih mutacija i omogućava unapređenje genoma u smislu postizanja veće adaptivne vrednosti. Nasuprot tome, eukariotske vrste odlikuju se manjim populacijama što omogućava fiksiranje neadaptivnih mutacija. Po ovoj teoriji, introni su verovatno isprva bili neadaptivni, ali su zatim kooptirani u vršenje različitih funkcija genske regulacije, pošto introni imaju regulatorne sekvence kao mikro RN kiseline. Linčova hipoteza suštinski naglašava da veličina populacije može veoma uticati na fiksiranje neadaptivnih karakteristika u genomima. Mnogi eukariotski genomi su isprekidani takozvanim splajsozomnim intronima. To su introni kojima je neophodna kompleksna grupa proteina zvanih splajsozomi da bi bili uklonjeni sa informacione RNK. Genomi bakterija i arhea imaju samo nekoliko introna koji mogu sami da se spletu pa im nisu potrebni splajsozomi. Hipoteza ranih introna Voltera Džilberta sugeriše da su introni postojali i kod najstarijeg zajedničkog pretka svih živih bića, a da su se tokom evolucije gubili u genomima onih vrsta koje ih danas ne poseduju. Na ovakvo sagledavanje porekla introna navela ga je izvesna sličnost između prokariotskih i eukariotskih introna. Međutim, mnogi introni ne postoje ni kod drevnih grupa organizama, pa je realnija hipoteza koja smatra da su oni nastali relativno kasno u evolucionoj istoriji i da nisu bili prisutni kod zajedničkog pretka eukariota, niti kod zajedničkog pretka eukariota i bakterija (hipoteza kasnih introna ). Savremene analize su pokazale da je zajednički predak svih eukariota verovatno imao mnogo introna preko 2 introna po kilobazi. Takođe, Linčova hipoteza o neadaptivnom poreklu introna putem genetičkog drifta u malim populacijama izgleda prilično realna. U malim populacijama, introni će se mnogo više održavati nego gubiti, zbog povećane stope fiksiranja štetnih mutacija u malim populacijama, dok će u velikim populacijama introni mnogo češće nestajati nego nastajati jer će ih prirodna selekcija veoma efikasno odstranjivati.
Eukariotski genomi sadrže mnogo više nekodirajuće DNK nego prokariotski. Samo oko 1.5% ljudskog genoma sastoji se od sekvenci koje kodiraju proteine. Oko 95% tipičnog ljudskog genoma sastoji se od introna. Većina nekodirajuće DNK nosi naziv sebična DNK jer se pretežno sastoji od transpozonskih elemenata (TE). Naučnici su otkrili 2001 godine da je više od 10% nekodirajuće DNK veoma očuvano između vrsta koje su veoma davno divergirale od zajedničkog pretka, kao na primer ljudi i miševi. Mnogi eukariotski geni, nasuprot prokariotskim, podležu takozvanom alternativnom splajsovanju (AS), dok je mnogo informacionih RNK kodirano od strane pojedinačnih gena. Veliki deo genoma sastoji se od ponovljenih DNK sekvenci. Njihov drugi naziv je SATELITSKA DNK i glavni izvor ovih sekvenci su transpozonski elementi. Relativno skoro je otkrivena klasa kratkih rasutih nuklearnih elemenata (short interspersed nuclear elements - SINE) koji su kao aktivni postojali kod drevnih riba coelocanth-a. Kopije te klase SINE opstale su tokom evolucije kičmenjaka i kooptirane su kao funkcionalni multiplikator koji kontroliše ekspresiju transkripcionog faktora ISL1 kod sisara, koji opet kontroliše diferencijaciju motornih neurona. Ova klasa SINE je takođe konzervirana u grupi egzona u ljudskom genomu, poznatih kao PCB2. Ovaj primer pokazuje kako neki TE koji su se veoma davno multiplicirali i postojali kao neaktivni u genomu, naknadno mogu biti kooptirani za izvođenje značajnih funkcija u genomu. Eukarioti imaju široku paletu transpozonskih elemenata, pri čemu mnogi od njih nisu zajednički za velike klade. Kako su nastali TE, još uvek nije jasno. Uglavnom, u kopijama retro elemenata koje bivaju prenešene na nova mesta u genomu dešavaju se tačkaste mutacije, kao i u genima domaćinima. Transpozonski elementi nastavljaju da proizvode kćerke elemente ili, mnogo češće, degenerišu putem mutacija i postaju neaktivni elementi koji se više ne prenose. Mutacije u takvim elementima mogu biti upotrebljene za određivanje odnosa između kopija u genomu, tako da starost TE familije može biti procenjena na isti način kao i vreme divergencije vrste. Efekat novog transpozonskog događaja na adaptivnu vrednost organizma uveliko zavisi od mesta na genomu gde se događaj odigrao. Mnogi transpozonski događaji su štetni jer utiču na funkciju gena pored kojih ili u koje se insertuju. TE pretežno postoje u regionima između gena i u intronima, verovatno zbog toga što oni koji se dese u kodirajućim regionima gena izazivaju štetne efekte i ubrzo bivaju eliminisani pročišćavajućom selekcijom. Transpozicije imaju najmanje dva tipa genetičkih efekata: prvo, izazivanje mutacija. Drugo, ponovljene kopije TE u različitim delovima genoma mogu predstavljati obrasce za nelegitimnu rekombinaciju, što rezultira rearanžmanima hromozoma ili gena koje često sadrže deleciju nekog dela genetičkog materijala. Oko 0.3% svih humanih
genetičkih poremećaja, uključujući mnoge nasledne tipove leukemije, smatra se da je nastalo na ovaj način. Predpostavlja se da je smanjenje adaptivne vrednosti domaćina zbog štetnih mutacija i hromozomskih rearanžmana bio glavni razlog što TE nisu mnogobrojnije u genomima domaćina. EVOLUCIJA I ROBUSTNOST PROTEINA Geni koji kodiraju proteine evoluirali su pretežno putem stabilizirajuće ili pročišćavajuće selekcije, prilikom čega broj sinonimnih tačkastih mutacija prevazilazi broj nesinonimnih substitucija. Drugi način evolucije ovih gena je putem GREŠKE KODONA. Greška kodona je mera odstupanja učestalosti sinonimnih kodona određene amino-kiseline od jednakih učestalosti. Nulta hipoteza podrazumeva će svi kodoni koji determinišu istu aminokiselinu biti podjednako zastupljeni, ali to obično nije tako. Jedan sinonimni kodon je uvek dominantan. Korelacija između sposobnosti organizma da preživi bez određenog gena i stope evolucije tog gena je relativno slaba u poređenju sa analognim korelacijama sa nivoom ekspresije gena ili učestalošću proteina. Stopa evolucije određenog proteina može u velikoj meri biti objašnjena delovanjem selekcije za sprečavanje besmislenih grešaka tokom translacije, što treba da nametne najjači selektivni pritisak na visoko ekspresivne gene koji kodiraju proteine zastupljene sa visokom učestalošću u organizmu. Amino kiselinske sekvence se mogu suočiti sa sopstvenim selektivnim pritiskom. Sposobnost amino kiselinske sekvence da podržava pakovanje proteina u funkcionalnu trodimenzionalnu strukturu bez obzira na pojavljivanje mutacija naziva se translaciona robustnost. Na primer, molekul hemoglobina bez odgovarajuće trodimenzionalne strukture ne može da veže molekul kiseonika. Ovde i jedna besmislena greška prilikom translacije može da dovede do formiranja neaktivnog proteina i ako bi se to dešavalo proteinima koji se proizvode u velikom broju kopija po jedinici vremena u organizmu, ubrzo bi u organizmu postojala ogromna količina proteinskog otpada što bi mnogo koštalo i ćeliju i organizam. Translaciona robustnost je plastičan mehanizam koji omogućava posttranslacionu korekciju grešaka.
CILJEVI I METODE U PROUČAVANJU MOLEKULARNE EVOLUCIJE Za proučavanje molekularne evolucije koriste se metode kao PCR (reakcija polimeraznog lanca), DNK sekvencioniranje i različite tehnike za izolaciju ili lokalizovanje genskih produkata kao što su RNK transkripti i proteini. Informacije koje se dobijaju upotrebom ove tri metode koriste se u evolucionim istraživanjima u tri pravca: 1. Molekularni markeri kao oruđe Molekularni markeri se mogu koristiti za analizu tradicionalnih problema u evolucionoj biologiji. Identitet gena (ili njihovih primarnih produkata) nije sam po sebi od prvenstvenog značaja; istraživače interesuje da li su ti geni pogodni markeri za rešavanje određenog problema. Na primer, elektroforeza enzima i analiza DNK haplotipova koriste se za izračunavanje nivoa genetičke varijabilnosti unutar i između populacija, zatim za upoznavanje populacione strukture, protoka gena i sistema ukrštanja, za opisivanje genetičkih razlika između vrsta; analize rodoslova haplotipova (genska stabla) koriste se za izvođenje zaključaka o istoriji veličine populacije, protoka gena i selekcije; DNK sekvencioniranje koristi se za dobijanje informacije o filogenetskim odnosima između vrsta ili između viših taksona. 2. Molekularni dokazi evolucije fenotipova Da bi se detaljnije shvatili procesi koji izazivaju fenotipsku evoluciju, određena istraživanja usmerena su u pravcu prepoznajvanja gena koji utiču na određene biohemijske, fiziološke ili morfološke karakteristike. Ovi programi istraživanja su mnogo kompleksniji od onih koji koriste molekule samo kao markere. Primeri za ovakva istraživanja su identifikacija gena koji se nalaze u osnovi poligenske varijabilnosti i komparativna istraživanja gena koji upravljaju procesom razvića. 3. Proučavanje evolucije gena i genoma DNK sekvence i struktura genoma su osobine koje su predmet istraživanja same po sebi, kao i ponašanje, morfologija ili druge fenotipske karakteristike. Kakve opšte zaključke možemo izvesti o mehanizmima i evolucionim procesima koji kontrolišu brzine, obrasce varijabilnosti i promene gena i genoma?
Neka istraživanja procesa koji kontrolišu molekularnu evoluciju koriste eksperimentalne tehnike kao transformacija (inkorporiranje DNK jednog organizma u genom drugog). Do sada su se, uglavnom, većina istraživanja evolucije gena i genoma oslanjala na analize obrazaca variranja unutar i između populacija i vrsta. U nekim proučavanjima, istraživač sam nabavlja sve ili skoro sve podatke putem eksperimentalnih procedura, dok u drugim analizira baze podataka kao što je GenBank, u kojima su pohranjeni podaci o sekvencama iz publikovanih naučnih radova. Filogenetički uvid Rekonstrukcija izumrlih gena: Retropozoni (retrotranspozoni) su transpozonski elementi koji kodiraju enzim reverznu transkriptazu. RNK transkripti retropozona se obrnutim redom prepisuju u DNK kopije koje nakon toga bivaju ubačene u različite delove genoma. Transkripcija retropozonske DNK pokreće se u jednom "uzvodnom" promotorskom regionu. Genomi sisara sadrže različite kopije transpozona poznate kao L1. Kod roda Mus, neke kopije L1 imaju aktivan promotor označen kao A, a druge imaju neaktivan promotor, označen kao F (kod ovih drugih kopija, transkripcija biva aktivirana promotorima susednih gena). Sekvenca F promotora od 200-bp varira između kopija tog elementa kao i između selekcionisanih linija miševa i pretpostavlja se da je inaktivirana putem različitih mutacija tokom oko 6 miliona godina. Molekularni biolog Nils Edi i saradnici (1994) pokušali su da rekonstruišu predački funkcionalni promotor iz koga su evoluirale neaktivne F sekvence. Koristeći filogenetsku analizu 30 različitih sekvenci F promotora, koristili su princip parsimonije da dobiju najbolji proračun predačke sekvence (na primer, na nukleotidnom mestu 213, neke sekvence imaju G, a neke C, i filogenetsko stablo ukazuje da je verovatno C bilo predačko stanje tog nukleotidnog mesta; slični proračuni su izvršeni za sva varijabilna mesta u okviru F sekvence). Istraživači su potom sintetisali pretpostavljenu predačku F sekvencu i zakačili je za Reporter gen, gen čiji proteinski produkt može biti detektovan ako promotor omogući da se izvrši genska transkripcija. Ovi konstrukti su ubačeni u ćelije kulture tkiva miša. Eksperiment je bio uspešan: nivoi proteina proizvedeni od gena sa sintetičkim promotorom bili su jednaki nivoima proteina proizvedenim od strane kontrolnih gena za koje je prirodno aktivan A promotor bio prikačen. Ovaj eksperiment podržava hipotezu da su inaktivne kopije nastale od funkcionalne sekvence.
Zaključivanje o rekombinaciji i transferu gena: U odsustvu rekombinacije, svi geni jednog genoma imaće istu istoriju prenosa i identične genealogije (rodoslove). Danijel Dikhjuizen i saradnici utvrdili su da se prikazi filogenetskih stabala linija bakterije E. coli razlikuju u zavisnosti od toga koja od tri genske sekvence je analizirana. Zaključili su da se, protivno prethodnim zaključcima da je E. coli skoro u potpunosti aseksualan organizam, razmena genetičkog materijala veoma često dešava. Slično, virogen (gen nastao reverznom transkripcijom gena virusa) u genomima nekoliko blisko srodnih vrsta mačaka je veoma sličan po sekvenci istom genu kod babuna. Ovo je jedan od potvrđenih slučajeva horizontalnog prenosa gena među različitim vrstama eukariota, tj kretanja gena među organizmima na drugi način nego putem prenosa sa roditelja na potomstvo. Mada neki istraživači sugerišu da je horizontalni prenos gena u evolucionoj istoriji biljaka i nekih drugih grupa bio dovoljno čest da doprinese rasprostranjenju osobina koje je obično pripisano konvergentnoj evoluciji, nema dokaza koji podržava suštinsku ulogu horizontalnog prenosa gena u evoluciji eukariota. Horizontalni prenos gena izgleda da je prilično uobičajen između nekih vrsta bakterija. Ovaj fenomen može imati važne medicinske posledice; na primer, bakterija Neisseria gonorrheae, uzročnik gonoreje, izgleda da je postala rezistentna na penicilin putem horizontalnog prenosa gena sa nepatogenih vrsta bakterija. EVOLUCIJA DNK SEKVENCI Podaci o varijabilnosti DNK sekvenci postaju dostupni od kraja sedamdesetih godina XX veka. Isprva su površno i nepotpuno tumačeni na osnovu variranja restrikcionih mesta (RFLPs), a kasnije je tumačenje postalo znatno preciznije, na osnovu prepoznavanja kompletnih nukleotidnih sekvenci. Ovi podaci postaju glavni predmet interesovanja populacionih genetičara u pokušaju otkrivanja koji evolucioni procesi su igrali važnu ulogu u evoluciji DNK sekvenci. Sukob tumačenja selekcionisti/ neutralisti koji je bio usmeren na varijabilnost alozima, preusmerio se na variranje DNK sekvenci. Ova debata se odnosi na to da li je unutarpopulaciona varijabilnost i međupopulaciona divergencija kao i divergencija između vrsta proizvedena putem genetičkog drifta ili prirodne selekcije. Sve više i više ima dokaza da postoji i adaptivna molekularna evolucija, kao, na primer, studija na Drosophila
simulans koja je pokazala da je oko 45% svih aminokiselinskih zamena fiksirano putem prirodne selekcije. Ali, bez obzira na to, neutralna teorija je još uvek polazna tačka svake analize evolucije DNK sekvenci. Obrasci variranja DNA sekvenci Prvi podaci o intraspecijskoj varijabilnosti kompletne sekvence gena dobijeni su iz studije Martina Krejtmena o lokusu za alkoholnu dehidrogenazu kod D. melanogaster. Od 11 genskih kopija, samo 1 od 2721 mesta imalo je substituciju koja rezultira promenom aminokiseline (nesinonimna tj substitucija zamenom), ali 42 mesta pokazala su sinonimne substitucije (treba razlikovati pojam MUTACIJA -promena unutar jedne genske kopije- od pojma SUBSTITUCIJA - delimična ili potpuna zamena jednog nukleotida ili duže sekvence drugom u okviru jedne populacije ili vrste). Mnogo više mesta variralo je u okviru intronskih u odnosu na egzonska mesta. Rodoslov (filogenija) sekvenci pružila je uvid da je upravo rekombinacija unutar tog regiona proizvela neke od varijanti genskih kopija. Noviji podaci o genima koji kodiraju različite proteine ukazali su na postojanje sličnih obrazaca. Neka od najranijih istraživanja interspecijske divergencije DNK od strane Vilsona, Brauna i saradnika, rađena su na mitohondrijalnoj (mt) DNK korišćenjem varijabilnosti restrikcionih mesta i sekvencioniranjem DNK. Mitohondrijalni geni, koji nemaju introne, nalaze se na jednolančanom, prstenastom hromozomu i nasleđuju se kod većine vrsta samo preko jajne ćelije (materinsko nasleđivanje), te se rekombinacija ne dešava. Nekoliko obrazaca utvrđenih u tim ranim radovima pokazali su se opštim, ne samo za mitohondrijalne već i za nuklearne gene. Kada se proporcija baznih parova koji se razlikuju između parova vrsta vremenski rasporedi, od zajedničkog pretka (proračunato na osnovu fosilnih nalaza), kriva prvo raste, a onda dostiže horizontalni nivo. To se dešava zato što se tokom dovoljno dugog vremenskog perioda na istim mestima dešavaju multiple substitucije, tako da prvobitne substitucije bivaju "izbrisane" novijim. Tako dobijeni broj razlika između dve filogenetski prilično udaljene vrste izgleda manji od broja substitucija koje su se zaista dogodile. Za mt DNK sisara, odnos između divergencije sekvenci i vremena proteklog od odvajanja od zajedničkog pretka je linearan samo tokom prvih 5 10 miliona godina; to je samo onaj deo krive gde broj nukleotidnih razlika daje direktan proračun brzine evolucije sekvence. Ova brzina, za sisarsku mtdnk, je 5 do 10 puta veća od prosečne brzine evolucije sekvenci u nuklearnom genomu, verovatno zbog toga što DNK polimeraza koja pravi kopiju
(repliku) mt DNK nema sposobnost ispravljanja (korekcije) koju ima polimeraza koja kopira nuklearnu DNK, tako da mt DNK ima veću stopu mutacija. Kako bilo, mt DNK i nuklearna DNK evoluiraju skoro podjednakom brzinom u nekim grupama beskičmenjaka. Kada su Braun i saradnici uporedili mt DNK sekvence nekoliko vrsta Primata, poređenjem vrsta koje su relativno skoro divergirale od zajedničkog pretka uočili su da tranzicije (substitucije jednog purina drugim ili jednog pirimidina drugim) uveliko nadmašuju transverzije (substitucije purina pirimidinom i obrnuto), mada su ova dva tipa substitucija bila skoro podjednako zastupljena ako se posmatra duže vreme divergencije. Tokom vremena opažamo da transverzije postaju mnogo manje zastupljene i treba im više vremena da bi se akumulirale. Ovo opažanje, koje se pokazalo opštim i za mitohondrijalnu i za nuklearnu DNK, bilo je iznenađujuće, jer, među mogućim nukleotidnim substitucijama, transverzija može biti više nego dvostruko u odnosu na tranzicije. Drugo posmatranje mitohondrijalne DNK koje se pokazalo opšte važećim je da se, između vrsta, neme (sinonimne) nukleotidne substitucije akumuliraju brže nego nesinonimne (substitucije zamene amino kiselina). Promene druge baze u okviru kodona, koje najčešće dovode do promene amino kiseline u proteinskom lancu, manje se razlikuju između vrsta nego promene treće baze. Brzine evolucije sekvenci su najniže za gene koji kodiraju proteine kao histoni, za koje se smatra da imaju tačna funkcionalna ograničenja; nasuprot tome, brzine evolucije sekvenci su najveće kod nefunkcionalnih pseudogena. Pseudogeni, introni i druge sekvence za koje se pretpostavlja da se ne "prevode" u proteinske produkte, pokazuju veće brzine evolucije sekvenci od kodirajućih regiona. Interpretiranje varijabilnosti DNK sekvenci: Teorija Neutralna teorija molekularne evolucije Moto Kimure, kasnije razrađena od strane nekoliko drugih populacionih genetičara, predstavlja "nultu hipotezu" sa kojom se porede podaci o molekulskoj varijabilnosti. Obrasci molekulske varijabilnosti mogu se objasniti putem genetičkog drifta selektivno neutralnih mutacija sve dok ne odstupaju značajno od obrazaca koje predviđa neutralna teorija. Ako je u0 stopa selektivno neutralne mutacije po genu po generaciji, tada je brzina substitucije (brzina zamene u populaciji) nezavisna od veličine populacije i predstavlja se jednačinom k= u0 po generaciji (brzina substitucije po jedinici vremena je k/g, gde je g dužina trajanja generacije). Očekuje se da će se dve populacije iste ili različitih vrsta koje su
bile izolovane međusobno u razmaku od t generacija, razlikovati za 2u 0t substitucija. Varijabilnost unutar populacije koja se nalazi u Hardi-Vajnbergovoj ravnoteži, merena učestalošću heterozigota po nukleotidnom mestu, jednaka je 4Neu 0, gde je Ne efektivna veličina populacije (4Neu0=θ). Za neutralne mutacije, θ može biti izračunato putem S (broj segregirajućih odnosno varijabilnih nukleotidnih mesta u uzorku genskih kopija (sekvenci)), ili putem d, prosečnog broja nukleotidnih razlika između parova sekvenci u uzorku. Ako se dve klase sekvenci (različiti geni, ili introni u odnosu na egzone ili različita kodonska mesta) razlikuju u uo, mesta sa većom u 0 će pokazati i veću intraspecijsku varijabilnost i veću interspecijsku divergenciju. Prirodna selekcija može modifikovati ove obrasce na tri načina. Pročišćavajuća selekcija odstranjuje ili smanjuje učestalost štetnih mutacija u populaciji; pozitivna ili direkciona selekcija fiksira sekvencu (gen) koji sadrži korisnu mutaciju; balansna selekcija, zahvaljujući faktorima kao preimućstvo heterozigota, selekcija zavisna od učestalosti fenotipa ili varirajuća selekcija, održava različite varijante sekvenci u populaciji. Ako je ukupna stopa mutacija ut, ali su neke od njih štetne i stoga odstranjene putem pročišćavajuće selekcije, tada je frakcija f0 tih mutacija neutralna, te je u0=utf0 u stvari stopa neutralnih mutacija. Smanjenje f 0 smanjuje u 0 i time brzinu substitucije (k) i nivo polimorfizma (θ). Što su funkcionalna ograničenja genskog produkta veća, to će smanjenje polimorfizma biti veće. Po neutralnoj teoriji, možemo očekivati da će k i θ biti manje za funkcionalne gene nego za pseudogene, za egzone u odnosu na introne, za mesta druge baze u odnosu na mesta treće baze na kodonima kao što to stvarno i jeste. Ako je mutacija neznatno štetna i ima opterećenje s, njena sudbina je prevashodno određena delovanjem genetičkog drifta ako je s << 1/(2Ne), ali je u suprotnom slučaju prevashodno određena delovanjem selekcije. Ako je Ne malo, veći broj mutacija je selektivno neutralno i tako raste stopa substitucije putem genetičkog drifta (k). Pošto genetički drift deluje brže u malim populacijama, smanjenje Ne smanjuje nivo unutarpopulacione varijabilnosti. Razmotrimo efekte selekcije na neutralnu varijabilnost na mestima koja su blisko vezana za mesta koja su pod delovanjem selekcije. Pozitivna direkciona selekcija smanjuje varijabilnost na blisko vezanim mestima. Ako se pojavi korisna mutacija na genu koji je do tada bio selektivno neutralan u populaciji, ako ima veoma malo ili nema uopšte rekombinacije u blizini korisne mutacije, ako je ta mutacija fiksirana od strane selekcije, onda će sve kopije tog gena u populaciji poticati od te jedne kopije u kojoj se pojavila mutacija. Selekciono neutralna mesta vezana za tu mutaciju biće takođe fiksirana efektom "autostopiranja".tako je sva neutralna varijabilnost u genu eliminisana, odstranjena selekcijom i varijabilnost je samo
malo rekonstituisana kao nove neutralne mutacije koje postoje među kopijama korisnog gena. Selekcija će eliminisati varijabilnost na dugom segmentu DNA u onim regionima genoma koji imaju niže stope rekombinacije. Efekti selekcije vidljivi su u genskim rodoslovima. Ako poredimo dva nevezana lokusa, jedan koji je evoluirao isključivo putem delovanja genetičkog drifta na neutralne mutacije i drugi koji je iskusio selektivno "čišćenje", u poređenju sa kopijama neutralno evoluirajućeg gena, kopije gena koje su fiksirane selekcijom nastale su od mnogo skorijeg zajedničkog pretka (onog kod koga se pojavila korisna mutacija). Te kopije su imale manje vremena da akumuliraju različite neutralne mutacije i zato su im sekvence sličnije. Selektivno čišćenje slično je delovanju efekta uskog grla na veličinu populacije po tome što smanjuje varijabilnost genskih kopija, ali efekat uskog grla obuhvata čitavu populaciju, a ne samo onaj njen deo obuhvaćen korisnom mutacijom. Efekti balansne selekcije su suprotni efektima pozitivne direkcione selekcije. Ponovo zamislimo da je rekombinacija niska u blizini nukleotidnog mesta na kome se dve varijante održavaju u polimorfnom stanju putem selekcije. Sve genske kopije u populaciji su nastale od dve predačke kopije (koje su nosile originalno selektivno korisne alternativne nukleotide), a svaka od njih je osnivač genske linije gena koji su akumulirali neutralne mutacije u blizini odabranog mesta. U poređenju sa genom koji je selektivno neutralan, DNK sekvenca koja je pod uticajem balansne selekcije pokazuje povećanu varijabilnost u blizini selekcionisanog mesta. U rodoslovu sekvenci prikupljenih iz populacije, zajednički predak svih sekvenci verovatno je stariji ako su one evoluirale samo putem genetičkog drifta, zato što je selekcija duže održavala te dve linije gena. Polimorfizam može biti održavan selekcijom tako dugo da se u međuvremenu može desiti specijacija. U tom slučaju, obe genske linije mogu biti nasleđene od strane dve ili više vrsta i neke genske kopije u svakoj vrsti mogu biti srodnije genima drugih vrsta nego drugim genima iste vrste. Pročišćavajuća selekcija protiv štetnih mutacija smanjuje polimorfizam blisko vezanih neutralnih mutacija. To je takozvana pozadinska selekcija. Za region DNK unutar koga je niska stopa rekombinacije, Ne je smanjena na proporciju gameta koji nisu vezani za štetne mutacije. Kao posledica, nivo heterozigotnosti neutralnih mutacija je smanjen. Smanjenje je najveće ako je stopa mutacije visoka, ako su mutacije sa veoma štetnim efektom i ako je stopa rekombinacije veoma niska.
GENSKE FAMILIJE I NOVE FUNKCIJE GENA GENSKE FAMILIJE predstavljaju skupove dva ili više gena sa sličnim DNK sekvencama. Članovi genske familije često nastaju nejednakim crossing over-om. Divergencijom dupliciranih gena nastaju ORTOLOGNI GENI, te su to homologi geni u genomima različitih vrsta. Nasuprot njima, različiti geni u okviru iste genske familije unutar iste vrste su PARALOGNI GENI. GENSKE FAMILIJE -Globini kičmenjaka: Predak Gnathostoma = predački globinski gen duplikacija mioglobin hemoglobin 500Mya (jednolančani globin u mišićima) duplikacija a-globin b-globin duplikacije Nekoliko članova a i b subfamilija eksprimiraju se u različito vreme tokom razvića. Mnoge genske familije, kao one koje kodiraju histone i nekoliko ribozomalnih RNK, imaju skoro homogene DNK sekvence i kolektivno proizvode ogromne količine istog genskog proizvoda. Pseudogeni su nefunkcionalni članovi genskih familija koji su nastali od funkcionalnih. Na primer, čovečija hemoglobinska familija sadrži 3 pseudogena i to su TRADICIONALNI PSEUDOGENI. Oni su homologi nekim sekvencama aktivnih globinskih gena. PROCESOVANI PSEUDOGENI nastaju reverznom transkripcijom mrnk transkripta u DNA i čine oko 9% ukupne DNK eukariota. EVOLUCIJA NOVIH FUNKCIJA Tradicionalna hipoteza podrazumeva da je novoduplicirani gen suvišan, da je njegovo prisustvo/odsustvo selektivno neutralno i da nesmetano nakupljanje mutacija dovodi do a) prelaska u pseudogene, b) nove funkcije koja ima selektivnu prednost i da je c) sudbina novog
lokusa nastalog duplikacijom određena trkom između fiksacije nultih mutacija koje ga utišavaju i pozitivnih mutacija koje vode novoj funkciji. Fiksacija pozitivnih mutacija i evolucija novih funkcionalnih gena nasuprot preovladavanju pseudogena moguća je kada 4N e sr >>1 gde je s=selektivna prednost nove mutacije, a r=odnos pozitivnih prema nultim mutacijama. Druga hipoteza smatra da duplicirani geni nastaju od predačkog koji ima dve funkcije, te da se duplicirani gen specijalizira za ekspresiju jedne od funkcija. Ovakvo stanovište upućuje na USKLAĐENU EVOLUCIJU GENSKIH FAMILIJA, a na to ukazuje i homogenost sekvenci među multiplim lokusima unutar organizma. Na primer, u humanom genomu, sekvenca za 18S r RNK i 28S r RNK ima 400 kopija. Skoro svaka jedinica ima prepoznavajuće mesto za restrikcioni enzim HpaI koje ne postoji kod čovekolikih majmuna. UZROCI duplikacije bili bi 1.Nejednaki crossing-over, nakon čega kopije hromozoma imaju samo jednu od varirajućih genskih sekvenci ili 2. Genska konverzija, gde, zbog mehanizama popravke DNK, enzimi kopiraju DNK sekvencu sa jednog homologog hromozoma na drugi. Postoje dve vrste genske konverzije: NEOPTEREĆENA, gde se svaka od dve varijante heterozigotne genske sekvence sa podjednakom verovatnoćom konvertuje u drugu i OPTEREĆENA, gde se jedna varijanta heterozigotne genske sekvence sa većom verovatnoćom konvertuje u drugu. Razlika između nejednakog crossing-over-a i genske konverzije je u tome što genska konverzija ne menja broj kopija ili ponovaka nukleotidne sekvence i kada se dešava među ponovljenim sekvencama, svaki takav događaj ima efekat ujednačavanja. ZNAČAJ USKLAĐENE EVOLUCIJE Ogleda se u tome što nastaju genske familije koje proizvode ogromne količine istovetnog genskog produkta (histoni, rrnk), što povećava funkcionalnost organizma. Prirodna selekcija može snažno uticati na postojanje usklađene evolucije. Uniformnost/raznovrsnost unutar genske familije zavisi od toga da li su adaptivniji raznovrsni ili istovetni, ali mnogobrojni genski proizvodi. TRANSPOZONSKI ELEMENTI
Barbara Mc Clintock je 1948 godine otkrila mobilne genetičke elemente u genomu kukuruza. Načini kretanja ovih partikula su: 1. kretanje putem direktne DNK replikacije i 2. reverzna transkripcija sa RNK kopije na DNK kopiju, koja se potom inkorporira u genom. Transkripcija se vrši putem retrotranspozona koji kodiraju enzim reverznu transkriptazu. Efekti su slični efektu mutacije. Na primer, kod bakterija, neki mobilni genetički elementi sadrže gene koji su korisni za domaćina, kao geni za otpornost na antibiotike i geni za metabolizam novih substrata. Međutim, u većini slučajeva, mobilni genetički elementi MGE sadrže samo informaciju za svoju sopstvenu replikaciju, pa se mogu smatrati genomskim parazitima. GLAVNA POSLEDICA DELOVANJA MOBILNIH GENETIČKIH ELEMENATA JE MUTACIJA. Mobilni genetički elementi se insertuju u kodirajući region gena i utiču (obično spreče) na funkciju gena. Do sada u prirodnim populacijama nije utvrđena adaptivna mutacija kao rezultat njihove insercije. Oni mogu imati glavnu ulogu u evoluciji arhitekture genoma, jer se kopije mobilnih genetičkih elemenata na različitim delovima hromozoma mogu rekombinovati, prouzrokujući strukturne izmene kao inverzije, translokacije i delecije. Evoluciona dinamika mobilnih genetičkih elemenata bila bi povećanje njihove učestalosti u populaciji tokom vremena, ako mutacija u okviru njih samih ubrzava stopu transpozicije i to bi bio primer SELEKCIJE NA NIVOU GENA, A NE GENOTIPA, tj priča o takozvanoj SEBIČNOJ DNK Imuni sistem kičmenjaka mogao je nastati putem inkorporiranja mobilnog genetičkog elementa koji je sadržao predačke forme RACI i RAC2 gena. Ovaj mobilni genetički element razdvojio je predački imunoglobulinski gen na nekoliko komponenti: V, O i J sekvence. Nastanak imunog sistema bio je bitan jer je to jedna od osobina koje su omogućile predačkim formama kičmenjaka osvajanje novih niša i potencijal za preživljavanje novih parazita. VISOKOREPETITIVNA DNK I VELIČINA GENOMA Veličina genoma se često meri u pikogramima (pg) DNK; 1 pikogram otprilike je ekvivalentan 1 Gb (gigabaza, ili 1 bilion baznih parova) genske sekvence. Na primer, haploidni genom jedne vrste ribe iznosi oko 0.3 Gb, a genomi čoveka i miša su oko 3 Gb svaki, dok daždevnjaci imaju ogromnu veličinu haploidnog genoma, čak do 50 Gb. Varijabilnost C-vrednosti uglavnom potiče od razlika u količini visokorepetitivne DNK. Visokorepretitivna DNK iznosi više od 90% eukariotskog genoma, a ponovljene sekvence imaju 2 više od 2000 baznih parova. Deli se na 1.mikrosatelitnu, 2.minisatelitnu i 3.satelitnu DNK. Visoko repetitivna DNK se uglavnom nalazi u regionima hromozoma gde je stopa
rekombinacije niska (telomere, okolina centromera, Y hromozomi). Nije poznato da li nukleotidne sekvence satelitne DNK utiču na adaptivnu vrednost. C-vrednost = ukupna količina DNK /jedru RNA virusi 10 3-10 4 nukleotida Bakterije 10 6-10 8 Gljive 10 7-10 9 Alge 10 7-10 12 Mahovine 10 9-10 11 Golosemenjače 10 10-10 11 Skrivenosemenjače 10 9-10 12 Sunđeri 10 8 Zglavkari 10 8-10 10 Košljoribe 10 9-10 10 Vodozemci 10 9-10 12 Gmizavci 10 9-10 10 Ptice 10 9 Placentalni sisari 10 9-10 10 Ukupna količina DNK ima sledeće biološke efekte: 1.utiče na veličinu ćelije i 2.utiče na stopu ćelijske deobe Brzina razvića je važna komponenta adaptivne vrednosti i životne istorije Broj ćelija može veoma uticati na funkcionisanje nervnog sistema i drugih organa. Relativna veličina i oblik mnogih osobina organizma pod uticajem su brzine razvića. Ako veličina genoma ne bi evoluirala, što je uglavnom uslovljeno količinom satelitne DNK, to bi ograničilo i evoluciju životnih istorija i morfološku evoluciju. EVOLUCIJA NOVIH GENA I PROTEINA Smatra se da su prvi živi organizmi sadržali samo nekoliko organizovanih sekvenci nukleinskih kiselina. Evolucioni biolozi opisali su nekoliko mehanizama putem kojih su geni u okviru genoma vrste mogli nastajati - bilo od već postojećih gena u istom genomu ili u genomu drugih vrsta. Ovi mehanizmi obuhvataju horiznontalni transfer gena, mešanje egzona, himerizam gena, retrotranspoziciju, multiplikaciju motiva i duplikaciju gena. Duplikacija gena Nakon nastanka genskih familija, dolazi do divergencije sekvenci i funkcija u okviru tih familija. Pretpostavljeno je da je celokupan kičmenjački genom bio dupliciran prvi put u
okviru zajedničkog pretka kičmenjaka sa čeljustima, a onda opet u okviru predaka riba. Smatra se, takođe, da su velike strukture sisarskih genoma nastajale kako velikim, tako i putem mnogo malih duplikacija. Nastanak novih gena putem duplikacije domena: DOMENI su kompaktni, kontinuirani regioni molekula proteina, prostorno odvojeni, i različitih funkcija. Na primer, ovomukoid protein belanceta koji inhibira tripsin ima tri domena. Svaki domen ima tripsin-vezujuće mesto. Kodirajući regioni domena su sličnih sekvenci i razdvojeni intronima. Svaki proteinski domen sadrži dva egzona (postoji delimična korespondencija između domena i egzona).pretpostavlja se da se evolucija ovomukoida odigrala kroz 2 uzastopne duplikacije predačkog gena sa 2 egzona. Ako jedan gen ima dve ili više funkcija, njegov primarni transkript informaciona RNK razlaže se na nekoliko informacionih RNK, koji aktiviraju sintezu nekoliko različitih polipeptida. Druga varijanta bila bi da sa gena, preko informacione RNK, bude aktivirana sinteza primarnog proteinskog proizvoda, koji se onda razlaže na nekoliko različitih polipeptida: kortikotropin, melanotropin i endorfin Nastanak novih gena putem mešanja egzona: Ova hipoteza posmatra egzone kao predačke gene koji su se mešali i slagali u puno različitih kombinacija i tako obrazovali savremene gene. Dokazi za realnost ove hipoteze ogledaju se u tome što egzoni gena odgovaraju različitim domenima proteinskog proizvoda, a srodni proteini imaju različite kombinacije istih domena ili modula. Po ovoj teoriji, pretpostavlja se da je današnja raznovrsnost gena u svim organizmima proistekla od oko najviše 1000 predačkih sekvenci. Geni eukariota sastoje se od egzona i introna. Proteinski domen (ili modul ) je mali (oko 100 aminokiselina) segment koji se može inkorporirati u specifičnu trodimenzionalnu strukturu nezavisno od drugih domena. Proteinski domeni često imaju specifične funkcije, mada ih ne mogu u potpunosti obavljati u odsustvu drugih domena sa kojima mogu da fomiraju funkcionalni protein. POSTANAK I EVOLUCIJA VIRUSA Mnogi genomi virusa kodiraju proteine za samo tri funkcije: replikacija sopstvenog genoma, formiranje spoljašnjeg omotača i integracija u genom domaćina. Postanak virusa objašnjava se dvema hipotezama:
Hipoteza I. Hauard Temin smatra da su virusi potomci pobeglih ćelijskih gena koji su stekli proteinski omotač i sposobnost da se repliciraju nezavisno od genetičkog materijala ćelija. Retroni su najjednostavniji entiteti koji imaju reverznu transkriptazu. Retropozoni su retroni koji imaju sposobnost promene mesta. Retrotranspozoni predstavljaju retropozone sa dugim ponovcima. Retrovirusi su retrotranspozoni sa strukturnim genima. Retroni, sticanjem sposobnosti premeštanja, formiraju retropozone, koji, kada steknu duge ponovke, postanu Retrotranspozoni. Sticanjem strukturnih gena, oni postaju Retrovirusi, koji, ako izgube sposobnost premeštanja, postaju Pararetrovirusi. Gubitak reverzne transkriptaze dovodi do formiranja DNK virusa (sa prstenastim genomom) od pararetrovirusa. Hipoteza II. Savremeni virusi predstavljaju potomke pre-ćelijskih oblika života i oduvek su bili nezavisni od genetičkog materijala koji se nalazi u ćelijama. Viroidi i satelitske RNK su ostaci najstarijih tipova RNK molekula. DNK virusi su živi predstavnici najstarijih oblika života zasnovanih na aktivnosti DNK, a retrovirusi predstavljaju potomke prvih reverznih transkriptaza Ove dve hipoteze ne isključuju jedna drugu. Novi oblici virusa nastaju i danas: SARS =Severe Acute Respiratory Sindrome, detektovan je u novembru 2002 u Kini. Do maja 2003. inficirao je 7000 ljudi, od kojih je 500 umrlo. Uzročnik ove viremije je nov virus SARS-CoV iz familije korona virusa (Coronoviridae) koji kodira 23 gena i nije nastao rekombinacijama poznatih korona virusa.