Abstrakt: | Prvá kapitola popisuje základné metriky na porovnávanie reťazcov a ich
vlastnosti. Medzi popisované metriky patrí Block distance , Dice
distance, Jaro distance, Jaro-Winkler distance, Hamming
distance, Levensthein distance, Needleman distance
, Smith-Waterman distance. Taktiež definujem dve vlastné
metriky na porovnávanie reťazcov a to Localized distance a Good distance. V
tejto kapitole zároveň porovnávam uvedené metriky a vyhodnocujem, ktoré
metriky sú vhodné na porovnávanie slovenských slov.
V druhej kapitole je popísaná metrika na porovnávanie textov, Monge-
Elkan recursive scheme. Túto metriku som upravila na MyMetric a
obe som potom otestovala na niekoľkých vzorkách textov a navzájom porovnala
|
---|