OmniPage 16: OCR v nové verzi - Grafika.cz - vše o počítačové grafice

Odběr fotomagazínu

Fotografický magazín "iZIN IDIF" každý týden ve Vašem e-mailu.
Co nového ve světě fotografie!

 

Zadejte Vaši e-mailovou adresu:

Kamarád fotí rád?

Přihlas ho k odběru fotomagazínu!

 

Zadejte e-mailovou adresu kamaráda:



Software

OmniPage 16: OCR v nové verzi

sw software

5. září 2007, 00.00 | OCR aplikace na převod skenovaných dokumentů do podoby editovatelných textů dospěla již do své šestnácté verze. V prodeji jsou dvě varianty OmniPage 16 a OmniPage 16 Professional, jejichž stručné představení vám nyní nabízíme, a to včetně srovnání možností obou variant programu a spousty screenshotů.

OmniPage, vlastněný momentálně společností Nuance Communications, má coby OCR program na převod skenovaných dokumentů do podoby editovatelných textů poměrně bohatou historii. Od doby prvních počítačů s pomalými procesory se hodně změnilo – současné CPU zvládne analyzovat dokumenty nesrovnatelně rychleji a převod stránky již netrvá desítky minut, ale několik sekund. Snad s výjimkou v budoucnu stále častěji využívaných simulací neuronových sítí (vylepšujících kvalitu OCR procesu) jsou proto prakticky všechny OCR balíky v nynější době spíše zaměřené na komfort práce a rozsah poskytovaných funkcí, čehož je již šestnáctá stěžejní verze OmniPage 16 jasným důkazem.

K dispozici jsou dvě varianty programu – levnější OmniPage 16 (pouze pro Windows) prodávaná za 150 USD a dokonalejší OmniPage 16 Professional za 500 USD, která existuje nejen ve verzi pro Windows, ale také ve verzi pro Mac OS X. Dominantou OmniPage 16 Professional je například technologie LFR (Logical Form Recognition), která umí rozpoznat formuláře ve vzorovém dokumentu a samozřejmě i rozvržení jednotlivých bloků textu, tabulek, grafiky a jiných objektů či prvků a vše převést do podoby zpětně editovatelného elektronického dokumentu.

OmniPage 16 vs. OmniPage 16 Professional

Značnou devizou OmniPage 16 je podpora 119 jazyků pro OCR proces – výčet není třeba uvádět, podpora češtiny a slovenštiny je samozřejmostí. Všechny slovníky byly dle dokumentace k programu vylepšeny a přesnost rozpoznávání navýšena až o 25 procent oproti předchozí verzi aplikace. Přesnost rozpoznávání předlohy je u běžných písem a kvalitních skenů vyšší než 99 procent, podobné je to ale i u dalších kvalitních OCR programů.


OmniPage 16 Professional - prostředí programu s automaticky nadefinovaným rozvržením sekcí převáděných článků na stránce, statistickými údaji a kontextovým menu


OmniPage 16 Professional - layout článků na stránce lze zvolit buď automatický (rozpoznávají se "okraje" článků) nebo podle několika předem zvolených šablon, včetně vícesloupcové sazby, tabulek, formulářů a dalších layoutů

Ve výrazně vyšší ceně OmniPage 16 Professional jsou obsaženy pro někoho zbytečné, pro někoho ale zase nepostradatelné funkce. Jedná se například o finanční slovníky, které ovšem nepodporují češtinu (stejně jako všechny další speciální slovníky), nebo třeba speciální zvýrazňování textů pomocí černého podkladu či přeškrtnutí. Součástí dodávky OmniPage 16 Professional je též software PaperPort 11 pro konverzi a správu papírových dokumentů, respektive jejich převod do elektronické podoby. Dalším důležitým rozdílem OmniPage 16 Professional vůči levnějšímu OmniPage 16 je podpora XPS, formátu Microsoftu pro elektronické dokumenty. Verze Professional dále nabízí podporu formátu PDF (včetně formulářů), možnost převádět skenované předlohy do různých grafických formátů a převádět či spíše „překonvertovat“ stávající textové dokumenty do jiného formátu. S tím souvisí i podpora textových formátů TXT a CSV pro tabulky, podpora XML datových struktur, práce s formuláři a integrace s balíky SharePoint 2003/2007. Výstupním formátem dokumentů OmniPage 16 může být mimo běžných formátů MS Wordu, MS Excelu či PDF také například HTML dokument nebo dokonce audio soubor s „předříkanými“ texty.


OmniPage 16 Professional - převedený text můžete v OmniPage přímo upravit pomocí vestavěného jednoduchého textového editoru


OmniPage 16 Professional - převedený text si můžete nechat i přeříkat počítačově simulovaným hlasem, na podporu češtiny ale v tomto případě zapomeňte

Značné rozdíly jsou u obou verzí OmniPage 16 také v automatizaci akcí. Jednotlivé pracovní úlohy můžete v OmniPage 16 Professional konfigurovat pomocí Workflow a Batch Manageru, který umí nejen definovat jednotlivé úlohy a spouštět je v přesně daném čase, ale také sledovat vybrané adresáře a spustit nastavené akce například vždy, když se ve zvoleném adresáři objeví nový (většinou naskenovaný či zkopírovaný) soubor. Batch Manager umí navíc sledovat i e-mailovou schránku, ze které pak dokáže přebrat dokumenty ke zpracování.


OmniPage 16 Professional - volby pomocníka Job Wizard pro spouštění akcí v nastaveném čase


OmniPage 16 Professional - Job Wizard slouží k tvorbě automatizovaných úloh, které lze spouštět v přesně stanoveném čase


OmniPage 16 Professional - s pomocí Batch Manageru můžete hromadně převádět naskenované předlohy do čistého textu či do dokumentů obsahujících i layout původní skenované předlohy

Úpravy dokumentů a formulářů

Jednou z novinek v OmniPage 16 je technologie 3DC, která umí narovnat i deformovanou skenovanou předlohu pořízenou například s pomocí digitálního fotoaparátu. Opravit lze především "zvlnění" dokumentů, mezi naprosté samozřejmosti pak patří úpravy barev, jasu, kontrastu a dalších běžných vlastností skenovaných předloh.

Skenovat a převádět do elektronické podoby můžete bez problémů i tištěné formuláře, které lze poměrně efektivně zpracovat, vyplňovat a ukládat ve formátu PDF, tuto funkci ale najdeme pouze u OmniPage 16 Professional. Dost důležitá je u OmniPage 16 Professional také podpora nativních formátů Microsoft Office 2007, včetně prezentací PowerPointu ve formátu PPTX, a podpora opět již výše zmíněného formátu XPS, což je Microsoftí obdoba elektronických PDF dokumentů, a to včetně případných konverzí mezi oběma formáty.


OmniPage 16 Professional - součástí programu jsou i funkce na image a color processingové úpravy naskenovaných podkladů, včetně prostorových deformací předlohy

Rychlost převodu a učení znaků

Rychlost konverze skenovaných předloh je na rychlém počítači bez výhrady vynikající. Autoři programu se chlubí tím, že OmniPage 16 je v současné době nejrychlejší OCR aplikace, což bych se sice tvrdit neodvážil, nicméně stránku A4 lze převést například do formátu MS Wordu za méně než 20 sekund. OmniPage 16 této rychlosti dosahuje mimo jiné s podporou vícejádrových procesorů a hyper-threadingu a také s výše zmíněnými vylepšenými OCR slovníky.

Pokud OmniPage 16 nerozpozná některé skupiny znaků (tzv. slitky) nebo jednotlivá písmena, automaticky nabídne funkce pro učení znaků. Fáze učení je poměrně jednoduchá a zahrnuje i pomocné předvolby pro nastavení uživatelských slovníků. Přesnost rozpoznávání znaků můžete ovlivnit také "namapováním" příbuzného písma, které už máte dopředu v OmniPage 16 naučeno, u zcela nových a tvarem odlišných písem (všechna běžná patková i bezpatková písma už program "zná") ale budete muset celý postup učení absolvovat znovu.


OmniPage 16 Professional - fáze učení chybně nebo částečně rozpoznaných znaků či skupin znaků

Závěrem

Jako celek je OmniPage 16 vyspělý OCR program, který má jen málo nedostatků. Verze Professional je ovšem pro běžné domácí uživatel příliš drahá a její možnosti automatizace akcí ocení spíše firemní uživatelé či aparát státní správy, který často potřebuje převádět spousty stran původně pouze tištěných či strojem psaných dokumentů do zpětně editovatelné elektronické podoby. Menší atraktivitu OmniPage 16 bude jistě mít (pro naše podmínky) na svědomí i chybějící plná česká lokalizace programu a mimo jiné též nelokalizované speciální slovníky pro různé oblasti lidské činnosti.


OmniPage 16 Professional - Workflow Assistant slouží k přehledné správě a definování základních operací prováděných programem


OmniPage 16 Professional - výběr uživatelských slovníků (podporovány jsou i slovníky MS Office)


OmniPage 16 Professional - součástí programu jsou i funkce pro vyhledávání a nahrazování textových řetězců


OmniPage 16 Professional - předvolby aplikace týkající se podpory jazyků pro OCR systém a speciálních "profesionálních" slovníků


OmniPage 16 Professional - podrobné nastavení pro exportovaný textový formát RTF

Tématické zařazení:

 » Rubriky  » VSE  

 » Rubriky  » Go verze  

 » Rubriky  » Skenery  

 » Rubriky  » Software  

 

 

 

 

Přihlášení k mému účtu

Uživatelské jméno:

Heslo: