Mistrz rozpoznawania

mistrz_rozpoznawania_thumbFineReader powoli zbliża się do perfekcji w rozpoznawaniu tekstu drukowanego, a jego producent wciąż ma pomysły, jak go udoskonalić. Przedstawiamy możliwości najnowszej edycji 9.0.

 

Nowości wprowadzone w obecnej wersji dotyczą przede wszystkim obsługi programu. Producent poddał gruntownym zmianom interfejs oraz wprowadził kilka opcji ułatwiających rozpoznawanie tekstu, np. funkcję automatycznej korekty zdjęć z aparatów cyfrowych.

 

Rozpoznawanie
Już poprzednia wersja – FineReader 8.0 – rozpoznawała tekst drukowany ze skutecznością na poziomie 99 procent. W wersji 9.0 udało się podnieść ją do 99,4 procent. Niby niewiele, ale to oznacza aż o 40 procent pomyłek mniej. Ważna nowość to ADRT (Adaptive Document Recognition Technology), której zadaniem jest analizowanie całego skanowanego dokumentu w celu lepszego rozpoznania układu testu. Potrafi zidentyfikować nagłówki, numerację stron itp. W wypadku tekstu podzielonego na kolumny zostaje zachowana kolejność jego przepływu. Po skopiowaniu do Worda te elementy są zachowane. W starszych wersjach FineReadera numeracja stron czy przypisy były kopiowane jako ramki. Warto w tym miejscu wyjaśnić, jak FineReader 9.0 analizuje dokumenty. Najpierw rozpoznaje pojdyncze litery. Na drugim etapie porównuje odczytane wyrazy ze słownikiem, co pozwala wykryć niektóre pomyłki powstałe na etapie rozpoznawania liter. Następnie analizuje układ tekstu na stronie, aby zachować akapity, kolumny itp. Ostatnim krokiem jest przejrzenie całego dokumentu z wykorzystaniem technologii ADRT. Nowości to także automatyczne wykrywanie języka dokumentu oraz lepsze rozpoznawanie elementów charakterystycznych dla pism urzędowych czy umów, np. pieczęci i podpisów.

 

Nowy interfejs FineReadera 9.0 ma ułatwić obsługę programu i przyspieszyć wykonywanie zadać. Prducent wprowadził też funkcje automatyzujące niektóre czynności.

 

Czytanie ze zdjęć
FineReader 9.0 ma ulepszone funkcje obróbki zdjęć z aparatu cyfrowego. Ich zadaniem jest taka modyfikacja fotografii, żeby mechanizm w OCR rozpoznał treść z najwyższą skutecznością. Teraz wszystkie te czynności program wykonuje automatycznie – prostuje wiersze, koryguje rozdzielczość i kąt nachylenia tekstu. Program potrafi także wykrywać na zdjęciach podwójne strony książek. Jeśli efekty jego działania są niezadowalające, możesz skorzystać z narzędzi do ręcznej korekty zdjęć.

 

Nowy interfejs
Największe zmiany zaszły w obrębie interfejsu graficznego. Modyfikacje miały podstawowy cel – zmniejszyć liczbę kliknięć potrzebnych do wykonania najczęstszych zadać. Dlatego pojawiło się okno Szybkie zadania, które otwiera się, gdy użytkownik włącza program. Znajdziesz w nim kilkanaście przcisków umożliwiających wykonanie takich czynności, jak skanowanie plików do formatu PDF, edytora Word lub arkusza kalkulacyjnego Excel. Co więcej, okno Szybkie zadania możesz przywołać, klikając ikonę w menu Start. Niektóre z funkcji FineReadera są też dostępne z poziomu menu kontestowego w Eksploratorze Windows, gdy klikniesz prawym przyciskiem myszy plik graficzny lub PDF. Nowością jest okno podglądu, wyświetlane przed otwarciem pliku. W wypadku dokumentów PDF pokazuje od razu liczbę stron i pozwala wybrać, które mają zostać przeanalizowane przez FineReadera. Program jest zintegrowany z aplikacjami pakietu Microsoft Office, co pozwala na szybkie importowanie tekstu z rozpoznanych dokumentów. Miejmy nadzieję, że w kolejnych wersjach FineReadera pojawi się także integracja z OpenOffice. W tej chwili nie można przesłać do niego rozpoznanego tekstu, który trzeba zapisać w pliku na dysku, a następnie otworzyć dokument w programie. FineReader ma wbudowany prosty edytor tekstu, umożliwiający wprowadzanie prostych poprawek przed zapisaniem pliku czy wysłaniem go do Worda. W obecnej wersji został rozszerzony o opcje formatowania tekstu (krój i wielkość czcionek). Obsługuje nowe formaty – pozwala na zapisywanie tekstu w plikach DOCX i XLSX. Istotną zmianą jest też możliwość edycji pierwszej strony dokumentu, jeszcze zanim FineReader ukoćczy rozpoznawanie pozostałych. W wypadku analizowania dużej liczby stron ważne jest też wprowadzenie obsługi procesorów wielordzeniowych. Szybkość rozpoznawania tekstu przez procesor dwurdzeniowy jest o ok. 60 procent większa niż przez procesor jednordzeniowy. Z kolei początkującym pracę ułatwią wskazówki i interaktywne porady, jak uzyskać lepsze efekty rozpoznawania tekstu. Program wyświetla specjalne okno dialogowe, w którym użytkownik ma możliwość wybrania kolejnej czynności.

 

Professional i Enterprise
FineReadera można kupić w dwóch wersjach, obie z polskim interfejsem graficznym. Podstawowa, Professional, jest przeznaczona dla użytkowników domowych lub do instalowania na wybranych komputerach w sieci firmowej. Z kolei wersja Enterprise, wyposażona w kilka dodatkowych funkcji, m.in. automatycznego analizowania plików zapisywanych we wskazanym folderze, może być instalowana na większej liczbie komputerów firmowych.

 

PC World Komputer listopad 2007

 

 

Zobacz inne artykuły:

Jaki program do PDF wybrać?

Format PDF stał się standardem w wielu dziedzinach życia, zarówno prywatnego, jak i biznes...

FineReader PDP w przedsiębiorstwie z branży spożywczej — case study

W branży spożywczej, gdzie procesy i jakość są kluczowe dla sukcesu przedsiębiorstwa, skuteczne zarz...

Jak uniknąć pułapek przy korzystaniu z oprogramowania OCR i edytowaniu plików PDF?

Żyjemy w erze cyfrowej, gdzie papierowe dokumenty coraz częściej są zastępowane przez ich elektronic...

OCR a IDP — najważniejsze różnice

Aktualnie w organizacjach ilość generowanych i przetwarzanych danych stale rośnie, a technologie zwi...