Fotografický magazín "iZIN IDIF" každý týden ve Vašem e-mailu.
Co nového ve světě fotografie!
Zadejte Vaši e-mailovou adresu:
Kamarád fotí rád?
Přihlas ho k odběru fotomagazínu!
Zadejte e-mailovou adresu kamaráda:
-
5. září 2024
Matrixmedia - Obsluha a tisk na velkoformátových digitálních tiskárnách
-
30. září 2024
-
4. října 2024
Software
OmniPage 17: OCR balík na zpětný převod tištěných dokumentů
Sken SW
13. ledna 2010, 00.00 | Ke zpětnému převodu tištěných textových dokumentů do elektronické podoby budete mimo skeneru nebo nouzově i digitálního fotoaparátu potřebovat ještě OCR software. OmniPage je ve své již sedmnácté stěžejní verzi komfortní a současně výkonný balík na převod vytištěných textů, tabulek či formulářů do zpětně editovaných dokumentů.
OmniPage společnosti Nuance Communications je specializovaný "kancelářský" OCR balík na převod dokumentů do zpětně editovatelné elektronické podoby. Sedmnáctá verze OmniPage existuje ve třech základních edicích pro Windows a v jedné (jinak číslované i funkčně vybavené) verzi pro Macintosh.
Nejlevnější edice programu stojí 150 USD, náročným uživatelům a pro firemní účely je určena edice Professional s cenou 500 USD, kterou ještě doplňuje multilicenční varianta Enterprise. Součástí obou dražších variant programu je balík PaperPort 11 a virtuální tiskový ovladač PDF Create, který slouží ke správě, archivaci a sdílení elektronických dokumentů ve formátu PDF včetně podpory systému Microsoft SharePoint.
Automatický i manuální převod dokumentů
Naskenovaný či importovaný dokument můžete do elektronické podoby převést v rychlém režimu Quick convert, u kterého OmniPage rozpozná rozvržení oblastí s textem, obrázky, tabulkami či formuláři, spustí OCR proces a poté nabídne dialogové okno pro uložení zkonvertovaného dokumentu. Druhou možností je manuální určení ploch s textem a dalšími oblastmi v layoutu dokumentu a různé kombinace ručně ovládaných akcí s automatickým OCR proces či korekcemi v podobě určení neznámých znaků, slitků písem apod.
OmniPage 17 Professional - prostředí programu s analyzovaným layoutem aktuální stránky dokumentu a textovým editorem s rozpoznaným textem
OmniPage 17 Professional - opravy a učení chybně identifikovaných znaků a slov
Základní image processingové operace se vstupními předlohami provádí OmniPage sám. Jedná se například o konverzi skenu do černobílé podoby používané pro samotný OCR proces, analýzu a opravu natočení dokumentu a další podobné (relativně jednoduché) operace. K dispozici navíc máte editor Image Enhancement, který umožňuje provádět manuální či automatizované korekce předlohy pro OCR – konkrétně třeba úpravu skosení a perspektivních úprav stránek dokumentu pomocí prostorové mřížky, upravit jas a kontrast předlohy, provést její oříznutí, odstranit šum či upravit rozlišení importované předlohy.
Kvalita převodu
OmniPage 17 umí pracovat s dokumenty v celkem 123 jazycích včetně češtiny, pro 119 z nich pak nabízí rozpoznávání znaků s přesností přes 99 %. Přesnost a tím i kvalita převáděných tištěných dokumentů do elektronické podoby závisí na několika faktorech. Těmi hlavními jsou kvalita naskenovaného/nafoceného dokumentu a také použití písem, které se ve zpracovávaném textu používají.
Běžná patková a bezpatková písma typy Arial/Helvetica či Times umí OmniPage rozpoznávat velmi dobře, stejně jako neproporcionální fonty typu Courier. U všech jmenovaných běžných písem nabízí OmniPage výše zmíněnou přesnost přes 99 %, u kvalitních zdrojových podkladů pak i přesnost blížící se prakticky 100 %.
V případě různých ozdobných písem je situace o mnoho horší a musíte programu pomoci ručními korekturami, nebo si dát tu práci a naučit OmniPage jednotlivé znaky a jejich spojení pro daný font – což se ale logicky vyplatí pouze při větším počtu stránek v převáděném dokumentu.
OmniPage 17 Professional - volba typu pracovní úlohy na hromadný respektive automatizovaný převod dokumentů
OmniPage 17 Professional - každou pracovní úlohu lze spustit v nastaveném čase
Novinky
OmniPage 17 přináší slušnou řádku novinek, které zasahují napříč spektrem většiny hlavních funkcí programu, a to včetně přibližně 2x rychlejší spouštění celé aplikace. První vylepšení najdeme u přípravy dokumentů pro OCR převod, na které je navázána analýza layoutu dokumentu. Rozpoznávání struktury předloh by mělo být u nové verze OmniPage přesnější především u tabulek, větších textových nadpisů, vertikálních textů a odsazení znaků v odstavcích.
Díky lepšímu využití vícejádrových procesorů je celý OCR proces viditelně „živější“, stejně jako reakce celé aplikace. Rozšířená je podpora ukládání převedených dokumentů, které lze nyní exportovat i ve formátu dokumentů pro čtečku elektronických knih Amazon Kindle, do které umí OmniPage 17 zkonvertovaný dokument i rovnou poslat. Ke sdílení dokumentů prostřednictvím technologie SharePoint (Portal Server 2003/2007) si můžete u OmniPage 17 připočítat ještě podporu aktuálních verzí správy dokumentů Open Text Hummingbird a Interwoven Manage.
Práci s více dokumenty usnadňuje nové dialogové okno Easy Loader pro současný import většího počtu dokumentů a prohlížení jejich náhledů i vyhledávání přímo v rámci importu souborů. Další novinkou je integrace s Microsoft Office přímo na úrovni akcí pro OCR proces, který můžete ovládat z Ribbon UI MS Office 2007.
Novinkou je i podpora asijských jazyků, konkrétně zjednodušené a tradiční čínštiny, japonštiny a korejštiny, a také automatické rozpoznávání kombinace evropských a asijských jazyků na stránce. Vylepšené jsou algoritmy pro analýzu předloh focených digitálními fotoaparáty, u kterých umí OmniPage 17 opravit optické zkreslení objektivů.
OmniPage 17 Professional - úprava vlastností stylu odstavců pro rozpoznaný text
OmniPage 17 Professional - textový editor umí nastavit také tabulátory používané často pro odsazení tabulek a textových bloků
OmniPage 17 Professional - textový editor umí i efekty typu Drop Caps
OmniPage 17 Professional - obecné styly pro odstavce textu
Závěr
Drobným záporem OmniPage 17 je (z pohledu českých uživatelů) chybějící česká lokalizace celé aplikace, češtinu ale program samozřejmě podporuje. Vestavěný textový editor a práce s automatizovanými úkoly na hromadný převod dokumentů jsou v OmniPage 17 velmi dobře zpracované, k duhu jde programu i podpora vícejádrových procesorů. Celkově lze říci, že OmniPage je špičková OCR aplikace, která patří společně s FineReaderem a Readiris k nejsofistikovanějším nástrojům na převod skenovaných či focených dokumentů do editovatelné elektronické podoby. Škoda jen, že OmniPage není k dispozici i ve zjednodušených či speciálních edicích (například pro konkrétní jazyk) s nižší cenou.
OmniPage 17 Professional - rozpoznaný text umí program také přečíst, podpora češtiny se ovšem nekoná
OmniPage 17 Professional - předvolby aplikace související přímo s OCR procesem
OmniPage 17 Professional - obecná nastavení programu
OmniPage 17 Professional - funkce pro vyhledávání a nahrazování textových řetězců v rozpoznaném textu
OmniPage 17 Professional - aktivace/deaktivace nástrojových panelů a ikon
-
14. května 2014
Jak vkládat snímky do galerií a soutěží? Stručný obrazový průvodce
-
23. dubna 2014
Konica Minolta přenesla výhody velkých zařízení do kompaktních modelů
-
12. června 2012
-
9. dubna 2014
-
29. listopadu 2013
-
6. září 2004
OKI snižuje ceny barevných laserových tiskáren C3100 a C5200n
-
13. května 2004
-
19. ledna 2004
QuarkXPress Passport 6: předvedení nové verze na konferenci Apple Forum 27.1.2004
-
6. února 2001
-
30. listopadu 2014
Nový fotoaparát α7 II: první plnoformát s pětiosou optickou stabilizací obrazu na světě
-
5. srpna 2024
Bubnový scanner na 4000dpi optické rozlišení + PC + software
-
8. září 2024
-
14. října 2024
-
5. listopadu 2024