Fotografický magazín "iZIN IDIF" každý týden ve Vašem e-mailu.
Co nového ve světě fotografie!
Zadejte Vaši e-mailovou adresu:
Kamarád fotí rád?
Přihlas ho k odběru fotomagazínu!
Zadejte e-mailovou adresu kamaráda:
-
30. září 2024
-
4. října 2024
-
14. listopadu 2024
-
11. prosince 2024
Software
Readiris 12 Pro/Corporate: výkonné OCR v češtině
sw software
31. srpna 2009, 00.00 | Snadno ovladatelná OCR aplikace na převod původně tištěných dokumentů do elektronických dokumentů slouží především k převodu (i vícesloupcových) textů, tabulek, vizitek či čárových kódů do podoby zpětně editovatelných dokumentů. Aktuální dvanáctá verze balíku Readiris podporuje přes 120 jazyků pro OCR proces, obsahuje mimo jiné českou lokalizaci a existuje ve dvou základních variantách Readiris Pro a Corporate. Popis programu a novinek v Readiris 12 najdete v článku.
Readiris společnosti I.R.I.S. je specializovaný OCR software na převod skenovaných či jiným způsobem importovaných bitmapových a PDF předloh do podoby editovatelných textů s různou strukturou včetně tabulek, formulářů a dokonce i čárových kódů. Zkonvertované texty umí Readiris uložit včetně rozpoznaného nebo manuálně nadefinovaného layoutu zdrojového dokumentu, a to v různých formátech například včetně souborů MS Wordu, PDF, XPS. MS Excelu a řadě jiných dokumentových formátů.
Podporu více než 120 jazyků pro OCR proces a mnoha lokalizací grafického rozhraní aplikace můžete využívat ve Windows a Mac OS X (zatím pouze Readiris ve verzi 11), pro které se Readiris prodává ve verzích Pro za 129 USD, nebo a Corporate s cenou 399 USD.
Readiris Pro vs. Corporate
Obě varianty Readiris 12 Pro a Readiris 12 Corporate jsou v současné době k dispozici pouze ve verzi pro Windows, k dispozici jsou i speciální verze Readiris 12 Asian a Middle-East s podporou arabštiny, farsi, hebrejštiny a různých asijských jazyků. Odlišnosti obou variant aplikace Pro a Corporate spočívají v různých specializovaných funkcích souvisejících s firemní sférou v oblasti archivace dokumentů a dávkových operacích. Konkrétně se u varianty Corporate jedná o například o podporu XPS a PDF/A dokumentů, integrovanou iHCQ kompresi, neomezeném počtu současně zpracovávaných stránek, možnost zabezpečit PDF dokumenty heslem, sledovat adresáře s dokumenty určenými pro OCR proces, rozpoznávání vizitek a také o automatické indexování obsahu PDF dokumentů.
Readiris 12 Corporate - přehledné prostředí aplikace s rozpoznanými a automaticky vyznačenými sloupci s textem
Readiris 12 Corporate - další ukázka z rozpoznaných sekcí pro OCR proces, tentokrát u komplexní naskenované předlohy s více sekcemi s různým obsahem
Převod dokumentů
Readiris 12 přímo podporuje mnoho desítek typů kancelářských a jiných běžných skenerů, které můžete s vhodným podavačem využívat jako zdroj převáděných dokumentů. Importovat můžete pochopitelně také libovolnou bitmapovou předlohu nebo PDF dokument. Celým OCR procesem vás může provést vestavěný wizard, který ovšem není vzhledem k celkové jednoduchosti ovládání aplikace vůbec nutné používat.
Layout importované předlohy umí Readiris sám analyzovat včetně bloků textů, obrázků, tabulek, obsahu vizitek (u verze Readiris 12 Corporate) a případně i čárových kódů a vyznačí si sekce pro OCR proces. Poté si můžete vybrat jazyk pro rozpoznávání písma respektive pro OCR proces a také cílový formát uloženého dokumentu. A to už je v podstatě všechno, neboť o zbytek se už postará samotný program.
Readiris 12 Corporate - průvodce alias wizard pro celý import dokumentu následný OCR proces
Readiris 12 Corporate - volba jazyka pro OCR proces, vybrat lze i více jazyků současně
Readiris 12 Corporate - volby pro zpracování layoutu dokumentů a OCR proces
Readiris 12 Corporate - výběr přímo podporovaných skenerů (včetně případných podavačů)
Readiris 12 Corporate - funkce pro jednoduché úpravy bitmapových předloh
Novinky
Jako vždy každá stěžejní verze, také Readiris 12 přináší opět o něco vylepšený OCR proces. Navenek se jedná o poměrně jednoduchou záležitost, interně je však OCR poměrně komplikovaný systém různých druhů analýzy obrysů a struktury písem a jejich konverzi, která by v Readiris 12 měla být až o třetinu rychlejší, a to zejména u komplexních dokumentů s více označenými sekcemi. Zběžné testy potvrdily, že převod je takřka okamžitý a i u poměrně složitých layoutů stránky je otázkou několik sekund pro jednu stranu.
Readiris 12 Corporate - podporované typy čárových kódů, které umí program indentifikovat a rozpoznat
Readiris 12 Corporate - u cílových formátů dokumentů "OCRkovaných" z importovaných předloh je opravdu z čeho vybírat
Novinkou je sada tlačítek SmartTasks pro rychlé spouštění oblíbených úloh jedním tlačítkem – například pro konverzi dokumentu do podoby dokumentu MS Excelu, MS Wordu či OpenOffice, jehož formát ODT je další novinkou, stejně jako u verze Corporate ukládání PDF/A a XPS (včetně pouze „obrázkových“ a další novinky – indexovaných textových) dokumentů. U PDF souborů je nově nabízena možnost ochránit dokumenty heslem.
iHQC komprese u zpracovaných dokumentů je něco jako MP3 a DivX/XviD komprese u audio a video a jejím výsledkem je mnohonásobně kratší PDF, PDF/A nebo XPS dokument s kombinací grafiky + textu. Vylepšeno je dále rozpoznávání a archivace vizitek, která probíhá s pomocí limitované edice balíku Cardiris 4, která je součástí Readiris 12 Corporate.
Závěr
Readiris 12 je sofistikovaná a velmi snadno ovladatelná OCR aplikace na převod různých druhů textově orientovaných tištěných a posléze naskenovaných dokumentů do čistě elektronické podoby. OCR proces v Readiris je poměrně spolehlivý, podporuje češtinu (+ řadu dalších simultánně fungujících jazyků) a umí se navíc učit, takže převod i rozsáhlejších naskenovaných dokumentů lze označit jako pohodlný a komfortní.
Demoverzi Readiris Pro nebo Readiris Corporate si můžete stáhnout zdarma z webových stránek společnosti I.R.I.S.
-
14. května 2014
Jak vkládat snímky do galerií a soutěží? Stručný obrazový průvodce
-
23. dubna 2014
Konica Minolta přenesla výhody velkých zařízení do kompaktních modelů
-
12. června 2012
-
9. dubna 2014
-
5. ledna 2017
-
6. září 2004
OKI snižuje ceny barevných laserových tiskáren C3100 a C5200n
-
13. května 2004
-
19. ledna 2004
QuarkXPress Passport 6: předvedení nové verze na konferenci Apple Forum 27.1.2004
-
6. února 2001
-
30. listopadu 2014
Nový fotoaparát α7 II: první plnoformát s pětiosou optickou stabilizací obrazu na světě
-
14. října 2024
-
10. prosince 2024