--- Preparácia dát ---
- sú to skripty v rámci diplomovky -
/projects/intron/candidas/extract_data.pl : Sada množstva nástrojov na extrakciu dát
/projects/intron/candidas/prepare_holdout_testing.pl : Vytvorenie štruktúry dát na holdout testovanie.


--- Popis zdrojákov ---
mlproject/MlProject.java : Spúšťací súbor. Obsahuje parsovanie vstupu a spúšťanie jednotlivých častí programu.
mlproject/hmm/EmissionModel.java : Rozhranie pre emisné modely.
mlproject/hmm/EvidenceEmissionModel.java : Implementácia emisného modelu, ktorý využívam.
mlproject/hmm/EvidenceHmm.java : Implementácia HMM, ktorý využívam.
mlproject/hmm/StateModel.java : Rozhranie pre stavové modely.
mlproject/hmm/EvidenceStateModel.java : Implementácia stavového modelu, ktorý využívam.
mlproject/io/InputSequence.java : Rozhranie vstupných sekvencií.
mlproject/io/IntegerInputSequence.java : Číselná vstupná sekvencia.
mlproject/io/StringInputSequence.java : Vstupná sekvencia predstavujúca postupnosť znakových režazcov.
mlproject/io/InputSequenceComposite.java : Vstupná sekvencia skladajúca sa z iných sekvencií rovnakej dĺžky.
mlproject/io/TrainingSequence.java : Trénovacia sekvencia skladajúca sa zo vstupnej sekvencie a stavov a jej stavov.
mlproject/io/FastaIterator.java : Fasta parser.
mlproject/io/InputReader.java : Rozhranie pre čítače vstupu.
mlproject/io/IntegerFastaInputReader.java : Načítava číselné sekvencie vo fasta formáte.
mlproject/io/NucleotideFastaInputReader.java : Načítava nukleotidové sekvencie vo fasta formáte.
mlproject/io/MultipleAlignmentInputReader.java : Načítava vianásobné zarovnania vo fasta formáte. Potrebuje k tomu fylogenetický strom.
mlproject/io/EvidenceCompositeInputReader.java : Spája predchádzajúce vstupy veci a dáva to dokopy.
mlproject/io/GTFStateInputReaderEvidence137.java : Načítava sekvencie z EvidenceCompositeInputReader a stavy k týmto sekvenciám z GTF. Vracia TrainingSequence.
mlproject/io/GTFWriter.java : Prepis stavov do GTF súboru.
mlproject/phylo/PhylogeneticTreeNode.java: Vrchol fylogenetického stromu.
mlproject/phylo/PhylogeneticTree.java: Implementácia fylogenetického stromu.
mlproject/phylo/NucleotideSubstitutionModel.java: Rozhranie substitučného modelu nukleotidov.
mlproject/phylo/Kimura80Model.java: Kimura 80 substitučný model nukleotidov.
mlproject/phylo/JukesCantorModel.java: Jukes-Cantor substitučný model nukleotidov.
mlproject/phylo/EvolutionaryModel.java: Evolučný model. Obsahuje implementáciu Felsensteinovho algoritmu.
mlproject/stats/Statistics.java: Sada metód pre zhodnotenie výstupov.
mlproject/util/Util.java: Pomocné metódy využívane v programe.

--- Narábanie s programom ---
Na spustenie treba mať nainštalovanú java 1.5

Program sa spúšta pomocou príkazu "java -jar EvidenceHMM.jar argumenty". EvidenceHMM.jar sa nachádza v "/projects/intron/hmm/bin/".

Formát argumentov pre testovanie jedného modelu, výstup sú podrobné štatistiky (správnosť vstupu nekontrolujem), navyše sa v adresároch test pre dané iterácie vypisuje GTF súbor s predikciami:
test adresar_datasetu povolenie_start_kodonu_ATA koeficient_pre_prechody typ_modelu
lokacia_datasetov: celá cesta zakončená lomítkom
povolenie_start_kodonu_ATA: 
	0 - zakázať 
	1 - povoliť
koeficient_pre_prechody: double väčšie ako 0
typ_modelu: 
	1 - všetky pásky 
	2 - všetko okrem Exonerate  
	3 - všetko okrem Phylo
	4 - všetko okrem weasel
	5 - iba exonerate 
	6 - iba phylo
	7 - iba weasel
	8 - žiadna páska

Príklad:
java -jar EvidenceHMM.jar test /projects/intron/hmm/datasets/holdout-Fri-Nov-20-01-54-17-2009/ 0 6.5 1

Formát argumentov pre testovanie všetkých modelov, výstup je tabuľka:
testAll adresar_datasetu povolenie_start_kodonu_ATA koeficient_pre_prechody

Príklad:
java -jar EvidenceHMM.jar testAll /projects/intron/hmm/datasets/holdout-Fri-Nov-20-01-54-17-2009/ 0 1
