OmniPage 17: OCR balík na zpětný převod tištěných dokumentů - Grafika.cz - vše o počítačové grafice

Odběr fotomagazínu

Fotografický magazín "iZIN IDIF" každý týden ve Vašem e-mailu.
Co nového ve světě fotografie!

 

Zadejte Vaši e-mailovou adresu:

Kamarád fotí rád?

Přihlas ho k odběru fotomagazínu!

 

Zadejte e-mailovou adresu kamaráda:



Software

OmniPage 17: OCR balík na zpětný převod tištěných dokumentů

Sken SW

13. ledna 2010, 00.00 | Ke zpětnému převodu tištěných textových dokumentů do elektronické podoby budete mimo skeneru nebo nouzově i digitálního fotoaparátu potřebovat ještě OCR software. OmniPage je ve své již sedmnácté stěžejní verzi komfortní a současně výkonný balík na převod vytištěných textů, tabulek či formulářů do zpětně editovaných dokumentů.

OmniPage společnosti Nuance Communications je specializovaný "kancelářský" OCR balík na převod dokumentů do zpětně editovatelné elektronické podoby. Sedmnáctá verze OmniPage existuje ve třech základních edicích pro Windows a v jedné (jinak číslované i funkčně vybavené) verzi pro Macintosh.

Nejlevnější edice programu stojí 150 USD, náročným uživatelům a pro firemní účely je určena edice Professional s cenou 500 USD, kterou ještě doplňuje multilicenční varianta Enterprise. Součástí obou dražších variant programu je balík PaperPort 11 a virtuální tiskový ovladač PDF Create, který slouží ke správě, archivaci a sdílení elektronických dokumentů ve formátu PDF včetně podpory systému Microsoft SharePoint.

Automatický i manuální převod dokumentů

Naskenovaný či importovaný dokument můžete do elektronické podoby převést v rychlém režimu Quick convert, u kterého OmniPage rozpozná rozvržení oblastí s textem, obrázky, tabulkami či formuláři, spustí OCR proces a poté nabídne dialogové okno pro uložení zkonvertovaného dokumentu. Druhou možností je manuální určení ploch s textem a dalšími oblastmi v layoutu dokumentu a různé kombinace ručně ovládaných akcí s automatickým OCR proces či korekcemi v podobě určení neznámých znaků, slitků písem apod.


OmniPage 17 Professional - prostředí programu s analyzovaným layoutem aktuální stránky dokumentu a textovým editorem s rozpoznaným textem


OmniPage 17 Professional - opravy a učení chybně identifikovaných znaků a slov

Základní image processingové operace se vstupními předlohami provádí OmniPage sám. Jedná se například o konverzi skenu do černobílé podoby používané pro samotný OCR proces, analýzu a opravu natočení dokumentu a další podobné (relativně jednoduché) operace. K dispozici navíc máte editor Image Enhancement, který umožňuje provádět manuální či automatizované korekce předlohy pro OCR – konkrétně třeba úpravu skosení a perspektivních úprav stránek dokumentu pomocí prostorové mřížky, upravit jas a kontrast předlohy, provést její oříznutí, odstranit šum či upravit rozlišení importované předlohy.


OmniPage 17 Professional - editor na image/color processingové úpravy bitmapových předloh

Kvalita převodu

OmniPage 17 umí pracovat s dokumenty v celkem 123 jazycích včetně češtiny, pro 119 z nich pak nabízí rozpoznávání znaků s přesností přes 99 %. Přesnost a tím i kvalita převáděných tištěných dokumentů do elektronické podoby závisí na několika faktorech. Těmi hlavními jsou kvalita naskenovaného/nafoceného dokumentu a také použití písem, které se ve zpracovávaném textu používají.

Běžná patková a bezpatková písma typy Arial/Helvetica či Times umí OmniPage rozpoznávat velmi dobře, stejně jako neproporcionální fonty typu Courier. U všech jmenovaných běžných písem nabízí OmniPage výše zmíněnou přesnost přes 99 %, u kvalitních zdrojových podkladů pak i přesnost blížící se prakticky 100 %.

V případě různých ozdobných písem je situace o mnoho horší a musíte programu pomoci ručními korekturami, nebo si dát tu práci a naučit OmniPage jednotlivé znaky a jejich spojení pro daný font – což se ale logicky vyplatí pouze při větším počtu stránek v převáděném dokumentu.


OmniPage 17 Professional - volba typu pracovní úlohy na hromadný respektive automatizovaný převod dokumentů


OmniPage 17 Professional - každou pracovní úlohu lze spustit v nastaveném čase


OmniPage 17 Professional - Workflow Assistant funguje jako komfortní průvodce celým OCR procesem

Novinky

OmniPage 17 přináší slušnou řádku novinek, které zasahují napříč spektrem většiny hlavních funkcí programu, a to včetně přibližně 2x rychlejší spouštění celé aplikace. První vylepšení najdeme u přípravy dokumentů pro OCR převod, na které je navázána analýza layoutu dokumentu. Rozpoznávání struktury předloh by mělo být u nové verze OmniPage přesnější především u tabulek, větších textových nadpisů, vertikálních textů a odsazení znaků v odstavcích.

Díky lepšímu využití vícejádrových procesorů je celý OCR proces viditelně „živější“, stejně jako reakce celé aplikace. Rozšířená je podpora ukládání převedených dokumentů, které lze nyní exportovat i ve formátu dokumentů pro čtečku elektronických knih Amazon Kindle, do které umí OmniPage 17 zkonvertovaný dokument i rovnou poslat. Ke sdílení dokumentů prostřednictvím technologie SharePoint (Portal Server 2003/2007) si můžete u OmniPage 17 připočítat ještě podporu aktuálních verzí správy dokumentů Open Text Hummingbird a Interwoven Manage.

Práci s více dokumenty usnadňuje nové dialogové okno Easy Loader pro současný import většího počtu dokumentů a prohlížení jejich náhledů i vyhledávání přímo v rámci importu souborů. Další novinkou je integrace s Microsoft Office přímo na úrovni akcí pro OCR proces, který můžete ovládat z Ribbon UI MS Office 2007.

Novinkou je i podpora asijských jazyků, konkrétně zjednodušené a tradiční čínštiny, japonštiny a korejštiny, a také automatické rozpoznávání kombinace evropských a asijských jazyků na stránce. Vylepšené jsou algoritmy pro analýzu předloh focených digitálními fotoaparáty, u kterých umí OmniPage 17 opravit optické zkreslení objektivů.


OmniPage 17 Professional - detail vestavěného textového editoru


OmniPage 17 Professional - úprava vlastností stylu odstavců pro rozpoznaný text


OmniPage 17 Professional - textový editor umí nastavit také tabulátory používané často pro odsazení tabulek a textových bloků


OmniPage 17 Professional - textový editor umí i efekty typu Drop Caps


OmniPage 17 Professional - obecné styly pro odstavce textu

Závěr

Drobným záporem OmniPage 17 je (z pohledu českých uživatelů) chybějící česká lokalizace celé aplikace, češtinu ale program samozřejmě podporuje. Vestavěný textový editor a práce s automatizovanými úkoly na hromadný převod dokumentů jsou v OmniPage 17 velmi dobře zpracované, k duhu jde programu i podpora vícejádrových procesorů. Celkově lze říci, že OmniPage je špičková OCR aplikace, která patří společně s FineReaderem a Readiris k nejsofistikovanějším nástrojům na převod skenovaných či focených dokumentů do editovatelné elektronické podoby. Škoda jen, že OmniPage není k dispozici i ve zjednodušených či speciálních edicích (například pro konkrétní jazyk) s nižší cenou.


OmniPage 17 Professional - rozpoznaný text umí program také přečíst, podpora češtiny se ovšem nekoná


OmniPage 17 Professional - předvolby aplikace související přímo s OCR procesem


OmniPage 17 Professional - obecná nastavení programu


OmniPage 17 Professional - funkce pro vyhledávání a nahrazování textových řetězců v rozpoznaném textu


OmniPage 17 Professional - aktivace/deaktivace nástrojových panelů a ikon

Tématické zařazení:

 » Rubriky  » VSE  

 » Rubriky  » Go verze  

 » Rubriky  » Software  

 

 

 

 

Přihlášení k mému účtu

Uživatelské jméno:

Heslo: