Meno:Martin
Priezvisko:Kravec
Názov:MCMC algoritmus na rekonštrukciu duplikačných histórií
Vedúci:Tomáš Vinař
Rok:2011
Blok:INF
Kľúčové slová:Markov chain Monte Carlo (MCMC), rekonštrukcia, duplikácia, história, evolúcia, bioinformatika
Abstrakt:V bunkách živých organizmov sa nachádza DNA, ktorá je nosicom genetickej informácie. Ak máme DNA sekvencie súcasných druhov, zaujímavou úlohou je predikcia ancestrálnej DNA sekvencie. Za predpokladu, že v rámci evolúcie uvažujeme iba proces jednoduchých mutácií, t.j. substitúcií jedného znaku za iný, je rekonštrukcia ancestrálnych sekvencií pomerne jednoduchá. Situácia sa komplikuje, ak zacneme uvažovat zložitejšie operácie väcšieho rozsahu, duplikácie. V tejto práci zavedieme pravdepodobnostný model evolúcie duplikovaných úsekov DNA (génových zhlukov) a inferenciu vzorkovaním za pomoci MCMC algoritmu. Ukážeme algoritmus na výpocet vierohodnosti histórií, ale najmä predstavíme nový algoritmus pre navrhovanie jednotlivých duplikácií pomocou dynamického programovania a stochastického spätného prechodu. Predbežné výsledky ukazujú, že implementácia tohoto algoritmu umožnuje rýchle MCMC vzorkovanie a získanie kvalitných výsledkov pri aplikácii tejto metódy na reálne dáta.

Súbory diplomovej práce:

kravec_dipl.pdf