Readiris 12 Pro/Corporate: výkonné OCR v češtině - Grafika.cz - vše o počítačové grafice

Odběr fotomagazínu

Fotografický magazín "iZIN IDIF" každý týden ve Vašem e-mailu.
Co nového ve světě fotografie!

 

Zadejte Vaši e-mailovou adresu:

Kamarád fotí rád?

Přihlas ho k odběru fotomagazínu!

 

Zadejte e-mailovou adresu kamaráda:

Poptávka práce


Software

Readiris 12 Pro/Corporate: výkonné OCR v češtině

sw software

31. srpna 2009, 00.00 | Snadno ovladatelná OCR aplikace na převod původně tištěných dokumentů do elektronických dokumentů slouží především k převodu (i vícesloupcových) textů, tabulek, vizitek či čárových kódů do podoby zpětně editovatelných dokumentů. Aktuální dvanáctá verze balíku Readiris podporuje přes 120 jazyků pro OCR proces, obsahuje mimo jiné českou lokalizaci a existuje ve dvou základních variantách Readiris Pro a Corporate. Popis programu a novinek v Readiris 12 najdete v článku.

Readiris společnosti I.R.I.S. je specializovaný OCR software na převod skenovaných či jiným způsobem importovaných bitmapových a PDF předloh do podoby editovatelných textů s různou strukturou včetně tabulek, formulářů a dokonce i čárových kódů. Zkonvertované texty umí Readiris uložit včetně rozpoznaného nebo manuálně nadefinovaného layoutu zdrojového dokumentu, a to v různých formátech například včetně souborů MS Wordu, PDF, XPS. MS Excelu a řadě jiných dokumentových formátů.

Podporu více než 120 jazyků pro OCR proces a mnoha lokalizací grafického rozhraní aplikace můžete využívat ve Windows a Mac OS X (zatím pouze Readiris ve verzi 11), pro které se Readiris prodává ve verzích Pro za 129 USD, nebo a Corporate s cenou 399 USD.

Readiris Pro vs. Corporate

Obě varianty Readiris 12 Pro a Readiris 12 Corporate jsou v současné době k dispozici pouze ve verzi pro Windows, k dispozici jsou i speciální verze Readiris 12 Asian a Middle-East s podporou arabštiny, farsi, hebrejštiny a různých asijských jazyků. Odlišnosti obou variant aplikace Pro a Corporate spočívají v různých specializovaných funkcích souvisejících s firemní sférou v oblasti archivace dokumentů a dávkových operacích. Konkrétně se u varianty Corporate jedná o například o podporu XPS a PDF/A dokumentů, integrovanou iHCQ kompresi, neomezeném počtu současně zpracovávaných stránek, možnost zabezpečit PDF dokumenty heslem, sledovat adresáře s dokumenty určenými pro OCR proces, rozpoznávání vizitek a také o automatické indexování obsahu PDF dokumentů.


Readiris 12 Corporate - přehledné prostředí aplikace s rozpoznanými a automaticky vyznačenými sloupci s textem


Readiris 12 Corporate - další ukázka z rozpoznaných sekcí pro OCR proces, tentokrát u komplexní naskenované předlohy s více sekcemi s různým obsahem

Převod dokumentů

Readiris 12 přímo podporuje mnoho desítek typů kancelářských a jiných běžných skenerů, které můžete s vhodným podavačem využívat jako zdroj převáděných dokumentů. Importovat můžete pochopitelně také libovolnou bitmapovou předlohu nebo PDF dokument. Celým OCR procesem vás může provést vestavěný wizard, který ovšem není vzhledem k celkové jednoduchosti ovládání aplikace vůbec nutné používat.

Layout importované předlohy umí Readiris sám analyzovat včetně bloků textů, obrázků, tabulek, obsahu vizitek (u verze Readiris 12 Corporate) a případně i čárových kódů a vyznačí si sekce pro OCR proces. Poté si můžete vybrat jazyk pro rozpoznávání písma respektive pro OCR proces a také cílový formát uloženého dokumentu. A to už je v podstatě všechno, neboť o zbytek se už postará samotný program.




Readiris 12 Corporate - průvodce alias wizard pro celý import dokumentu následný OCR proces


Readiris 12 Corporate - volba jazyka pro OCR proces, vybrat lze i více jazyků současně


Readiris 12 Corporate - volby pro zpracování layoutu dokumentů a OCR proces


Readiris 12 Corporate - výběr přímo podporovaných skenerů (včetně případných podavačů)


Readiris 12 Corporate - funkce pro jednoduché úpravy bitmapových předloh

Novinky

Jako vždy každá stěžejní verze, také Readiris 12 přináší opět o něco vylepšený OCR proces. Navenek se jedná o poměrně jednoduchou záležitost, interně je však OCR poměrně komplikovaný systém různých druhů analýzy obrysů a struktury písem a jejich konverzi, která by v Readiris 12 měla být až o třetinu rychlejší, a to zejména u komplexních dokumentů s více označenými sekcemi. Zběžné testy potvrdily, že převod je takřka okamžitý a i u poměrně složitých layoutů stránky je otázkou několik sekund pro jednu stranu.


Readiris 12 Corporate - podporované typy čárových kódů, které umí program indentifikovat a rozpoznat


Readiris 12 Corporate - u cílových formátů dokumentů "OCRkovaných" z importovaných předloh je opravdu z čeho vybírat

Novinkou je sada tlačítek SmartTasks pro rychlé spouštění oblíbených úloh jedním tlačítkem – například pro konverzi dokumentu do podoby dokumentu MS Excelu, MS Wordu či OpenOffice, jehož formát ODT je další novinkou, stejně jako u verze Corporate ukládání PDF/A a XPS (včetně pouze „obrázkových“ a další novinky – indexovaných textových) dokumentů. U PDF souborů je nově nabízena možnost ochránit dokumenty heslem.

iHQC komprese u zpracovaných dokumentů je něco jako MP3 a DivX/XviD komprese u audio a video a jejím výsledkem je mnohonásobně kratší PDF, PDF/A nebo XPS dokument s kombinací grafiky + textu. Vylepšeno je dále rozpoznávání a archivace vizitek, která probíhá s pomocí limitované edice balíku Cardiris 4, která je součástí Readiris 12 Corporate.

Závěr

Readiris 12 je sofistikovaná a velmi snadno ovladatelná OCR aplikace na převod různých druhů textově orientovaných tištěných a posléze naskenovaných dokumentů do čistě elektronické podoby. OCR proces v Readiris je poměrně spolehlivý, podporuje češtinu (+ řadu dalších simultánně fungujících jazyků) a umí se navíc učit, takže převod i rozsáhlejších naskenovaných dokumentů lze označit jako pohodlný a komfortní.

Demoverzi Readiris Pro nebo Readiris Corporate si můžete stáhnout zdarma z webových stránek společnosti I.R.I.S.

Tématické zařazení:

 » Rubriky  » VSE  

 » Rubriky  » Go verze  

 » Rubriky  » Software  

 

 

 

 

Přihlášení k mému účtu

Uživatelské jméno:

Heslo: