Abstrakt: | Technológia, ktorá sa zaoberá strojovým rozpoznávaním znakov, sa nazýva OCR. Táto technológia má vo svete pomerne veľké využitie, no napriek existencii viacerých metód riešiacich daný problém, ani jedna z nich nie je dostatočne univerzálna. Existuje výskum, na ktorom sa podieľali P. Frey a D. Slate, ktorí sa snažili využiť klasifikátorský systém na strojové rozpoznávanie znakov. Podstatou tohoto systému bolo vyjadrovanie tzv. features jednotlivých písmen pomocou využitia rôznych funkcií. Týmto spôsobom vyjadrili každé písmenko ako vektor čísiel a následne ich použili v strojovom učení. V našej práci sme sa rozhodli na tento výskum nadviazať a zistiť, či nedokážeme modifikáciami jednotlivých postupov zvýšiť úroveň rozpoznávania písmen. Zamerali sme sa hlavne na zaznamenávanie viac vlastností písmen pomocou väčšieho množstva parametrizovaných funkcií a obrázkových modulácií. Ako vzorku písmen sme si pripravili rozsiahle množstvo znakov v rôznych fontoch, ktoré sme ľubovolne zmodifikovali. Hlavným cieľom práce je zistiť, či je takýto prístup vhodný, všeobecne použiteľný a vedie k uspokojivým výsledkom.
|
---|