Metody rozpoznawania znaków 2
Dopiero w połowie lat 70. XX wieku technikę porównywania ze wzorcem zaczęto zastępować analizą cech charakterystycznych. Zamiast na podobieństwie całej litery skupiano się na jej poszczególnych elementach takich jak linie pionowe, linie poziome, proporcje tych linii, kulistość, zaokrąglenia, kształt krzywizn, zakończenia, współczynniki kątowe. Pozwalało to na rozpoznawanie niezależne od czcionki, gdyż każda litera składa się z określonych części. Na przykład litera „E” będzie rozpoznana gdy wykryjemy jedną pionową linię i 3 poziome, które są krótsze, przylegają do niej pod kątem prostym (lub zbliżonym do kąta prostego) od prawej strony w trzech miejscach. Na górze i dole oraz mniej więcej pośrodku. Opisanie w ten sposób liter jest dużo bardziej pracochłonne, ale także pozwala na większą skuteczność przy odczytywaniu znaków. Taka technika rozpoznawania znaków nazywa się „Omnifont” (łac. omni - wszyscy). Pierwszym urządzeniem, które korzystało z opisanej wyżej metody, był wprowadzony w 1975 roku czytnik KRM (Kurzweil Reading Machine) nazwany tak na cześć swojego twórcy - Raymonda Kurzweila.Na początku lat osiemdziesiątych rozpoczął się nagły rozwój nowej dziedziny nauki jaką była teoria sztucznych sieci neuronowych (Artificial Neural Network Theory lub Neurocomputing). Od samego początku sieci neuronowe znalazły zastosowanie w algorytmach rozpoznawania tekstu. Jednak w pierwszych latach były używane wyłącznie jako klasyfikatory. Na podstawie danych wejściowych, które obejmowały matematyczno-geometryczne cechy charakterystyczne znaku, podejmowały decyzję o tym, jaki to znak. W porównaniu z tradycyjnymi metodami, rozpoznawanie znaków za pomocą sieci neuronowych miało ogromną zaletę - możliwość uczenia się "na przykładach". Specjalnie stworzony zestaw uczący podany na wejście sieci pozwalał na przeszkolenie jej. Następnie, aby sprawdzić skuteczność sieci neuronowej testujemy ją zestawem weryfikującym. Poprawnie przeszkolona sieć powinna być odporna na jak największe zaburzenia i rozpoznawać znaki, które odbiegają wyglądem od swoich wzorcowych odpowiedników z zestawu uczącego.
Obecnie sieci neuronowe wykorzystywane są wówczas, gdy zawodzą inne techniki rozpoznawania znaków. Sieć pełni nie tylko rolę klasyfikatora, ale także sama wykrywa cechy charakterystyczne danego znaku. Odpowiednio połączone warstwy neuronów są w stanie, w trakcie uczenia, wyodrębnić z pikselowego obrazu zadanego znaku cechy geometryczne odróżniające go od innych liter. Poza tym niektóre modele ANN potrafią skutecznie rozpoznawać całe sekwencje mocno zdeformowanych i zakłóconych znaków bez konieczności podziału sekwencji na pojedyncze litery (rozpoznawanie bezsegmentacyjne).
Do rozpoznawania tradycyjnych tekstów dobrej jakości nie opłaca się stosować technik z użyciem sieci neuronowych, które charakteryzują się dużym czasem przetwarzania informacji. W takich przypadkach dużo bardziej efektywna jest metoda „omnifont”. W przypadku niewielkiej ilości mocno zaburzonych znaków takich jak te używane w technice CAPTCHA, sieci neuronowe mogą być bardzo dobrym rozwiązaniem. Jednak ogromna ilość i rodzaj zaburzeń stanowią duży problem nad wyborem odpowiedniego zestawu testowego.
01.12.2008. 18:43
Z tą współdziałamy od długiego czasu, więc warto ją obejrzeć: Księgarnia Internetowa. Z tą współdziałamy od któtkiego czasu, więc powinieneś ją odwiedzić: Harry Potter wszystkie części. Słyszałem, że ta strona internetowa jest niepowtarzalna: meble kolonialne. Z tą współdziałamy od paru miesięcy, więc musisz ją obejrzeć: PLC. Ta witryna na pewno spodoba Ci się, więc powinieneś ją zobaczyć: kursy kadry i płace.Spis treści
- Wstęp
- Cel pracy
- Definicja
- Historia
- Gdzie jest używana?
- Dlaczego jest używana?
- Przed czym chroni?
- Dlaczego CAPTCHA jest łamana?
- Kontrowersje
- CAPTCHA a rozpoznawanie znaków