Abstrakt: | V genóme eukaryotických organizmov sa vyskytujú zhluky génov, čo sú sekvencie DNA, v ktorých sa opakujú kúsky sekvencií iba s malými zmenami. Existujúce programy na anotáciu génov, ako napríklad Exonerate, ktorý vytvára anotáciu pomocou proteínových zarovnaní, nefungujú na týchto úsekoch DNA s dobrými výsledkami.
V našej práci používame program Exonerate na vytvorenie predbežnej anotácie obsahujúcej množstvo zmätočných transkriptov, ktorú potom upravujeme novovytvoreným algoritmom.
Problém anotácie sme transformovali na úlohu z teórie grafov, ktorú sme riešili heuristikou. Výsledky algoritmu sme testovali pri použití rôznych vstupných parametrov na zhlukoch génov AMY a PRAME na DNA sekvenciách z makaka a človeka.
Náš algoritmus splnil očakávania a podstatne vylepšil výstup programu Exonerate, ktorý teraz zmysluplne anotuje aj sekvenciu obsahujúcu zhluky génov.
|
---|