Fotografický magazín "iZIN IDIF" každý týden ve Vašem e-mailu.
Co nového ve světě fotografie!
Zadejte Vaši e-mailovou adresu:
Kamarád fotí rád?
Přihlas ho k odběru fotomagazínu!
Zadejte e-mailovou adresu kamaráda:
-
30. září 2024
-
4. října 2024
-
14. listopadu 2024
-
11. prosince 2024
Software
ABBYY FineReader 10: rychlý OCR převod skenovaných a nafocených dokumentů
sw software
13. října 2009, 00.00 | Převod textů ze skenovaných či nafocených podkladů do editovatelné podoby umožňuje OCR aplikace FineReader, jejíž jubilejní desátá verze přináší několik zajímavých novinek. Analýza předloh i samotný OCR proces jsou FineReaderu 10 velmi rychlé, přičemž využívat můžete hromadné zpracování více stran i vestavěný editor bitmapových či textových dokumentů. Podrobnější popis aplikace vám nyní nabízíme.
ABBYY FineReader je OCR aplikace, s pomocí které lze velmi snadno převádět skenované dokumenty do klasických editovatelných textů, tabulek a případně i čárových kódů. FineReader 10 existuje zatím jen ve verzi pro Windows, pro Mac OS X je zatím nabízena pouze starší „retardovaná“ verze Express za 89 EUR.
V prodeji je mimo běžné varianty Professional (139 EUR) ještě editace Corporate a pro větší firmy ještě edice Site Licence – obě poslední jmenované edice obsahují podporu síťových funkcí a Windows Server 2003/2008 a umí též sledovat obsah zvolených adresářů a e-mailových schránek.
ABBYY FineReader Professional 10 - úvodní obrazovka s nabídkou hlavních funkcí programu
Novinky
OCR proces ve FineReaderu si poradí s celkem 186 jazyky, z nichž lze pro 39 jazyků používat vestavěný speller s podporou uživatelských slovníků Microsoft Wordu. Pominu-li běžné marketingové výrazy ve stylu OCR proces je opět rychlejší a přesnější, zbývá v novinkách desáté stěžejní verze FineReaderu ještě několik jiných užitečných novinek. Jednou z nich je patentovaná ADRT analýza vícestránkových dokumentů do podoby jednoho spojitého dokumentu a vylepšený OCR proces pro nafocené předlohy dokumentů, které je možné do programu importovat například přímo z paměťové karty digitálního fotoaparátu.
Vylepšení doznala také analýza jazyků použitých v jednotlivých dokumentech, přičemž pro OCR proces je podporováno i více jazyků v jednom dokumentu. Další inovace se týkají pohodlnější tvorby poznámek pod čarou, přizpůsobení tzv. font matchingu písem nainstalovaných ve Windows a generování rejstříků. Pro nás asi bezvýznamnou novinkou je podpora korejštiny, kterou doplňuje ještě rozšířená podpora hebrejštiny.
Ovládání aplikace usnadňuje startovací obrazovka, upravené grafické rozhraní (včetně integrovaného textového editoru) a přehled rychlých úloh, které současně defacto fungují jako velmi jednoduchý průvodce celým OCR procesem a jsou nabízeny GUI aplikace v různých pracovních situacích. Novinkou u exportu „OCRkovaných“ dokumentů je možnost ukládání ebooků ve formátu HTML, který může obsahovat i nadefinované kapitoly a různé styly. Trochu lepší je komprese u exportovaných PDF dokumentů, které lze také archivovat v optimalizovaném formátu PDF/A.
ABBYY FineReader Professional 10 - layout naskenovaného/importovaného dokumentu umí FineReader automaticky analyzovat, sekce s textem, grafikou či případně čárovými kódy pro následný OCR proces můžete vyznačit také ručně
Skenování, import a úpravy předloh
FineReader 10 umí skenovat předlohy z celé řady TWAIN a WIA kompatibilních lokálních i síťových skenerů, a to dvěma způsoby. Prvním z nich je vlastní skenovací modul FineReaderu s poměrně jednoduchým ovládáním a možností skenovat více dokumentů či jejich částí. Druhá možnost je pak použití skenovacího modulu z Windows či dodávaného přímo ke skeneru. Naskenované nebo vyfocené dokumenty lze do programu pochopitelně též importovat v různých formátech, pro zpracování nafocených dokumentů je doporučen fotoaparát s rozlišením od 5 Mpix výš.
ABBYY FineReader Professional 10 - naskenované či importované předlohy si můžete jednoduše natočit a barevně či jinak obrazově je upravit přímo ve FineReaderu
Všechny bitmapové předlohy můžete rovnou ve FineReaderu upravit. Úpravy zahrnují především různé korekce zkreslení naskenovaných/vyfocených dokumentů včetně opravy trapézového zkreslení, narovnání řádků s textem, rozdělení stránky na více částí a samozřejmě i manuální natočení stránky, její oříznutí a jednoduché mazání nevhodných objektů. Součástí korekčních funkcí je dále i potlačení šumu u importovaných digitálních fotografií a jejich zaostření.
Analýza layoutu a čárové kódy
Sekce s čárovými kódy umí ve skenovaných či importovaných dokumentech FineReader 10 rozpoznat sám. Stejně tak se před OCR procesem analyzuje celá plocha předlohy a vyznačí se bloky textu, bloky s grafikou, tabulkami a jinými speciálními objekty. Rozmístění a layout jednotlivých bloků můžete upravit či nadefinovat ručně, slouží k tomu několik nástrojů na tvorbu rámečků. Čárových kódů rozpozná FineReader zhruba dvacet typů, patří mezi ně i novinky verze 10 v podobě typů Aztec Code a Data Matrix.
ABBYY FineReader Professional 10 - výběr jazyků pro OCR proces
ABBYY FineReader Professional 10 - preference programu pro skenování a import dokumentů
Rychlost OCR procesu
Největší spotřebu času si většinou nárokuje analýza layoutu naskenovaného či importovaného dokumentu, které může zabrat až desítky sekund u stran formátu A4. Samotný převod textů a celého layoutu předlohy je už pak poměrně rychlý, jedná se zpravidla o jednotky sekund. Na každou stranu A4 počítejte tedy v průměru s minimálně půlminutou času (bez skenování) pro kompletní analýzu a převod dané strany, kterou pak FineReader zobrazí ve svém vestavěném editoru.
Pro zpracování předloh s vysokým rozlišením a jednoduchým layoutem je k dispozici mód Fast Reading, který pracuje více než 2x rychleji než při analýze komplexních layoutů dokumentů.
ABBYY FineReader Professional 10 - výběr "typů" písem pro OCR proces
Úpravy a export dokumentů
Ještě před uložením dokumentů lze v integrovaném editoru FineReaderu převedené texty vhodně zkorigovat s pomocí spelleru (kontrolu gramatiky FineReader 10 nenabízí) – upravit styly textů a další běžné vlastnosti dostupné u editovatelných dokumentů včetně případné tvorby hyperlinků.
Hotové dokumenty zpracované OCR procesem můžete ukládat v celé řadě formátů, ve kterých může být obsažen i layout původních předloh. Pro export nabízí FineReader 10 například formáty DOC, DOCX, XLS, XLSX, PPTX, RTF, PDF (včetně zabezpečení), PDF/A, HTML, CSV a TXT, vloženou grafiku lze samostatně ukládat v různých bitmapových formátech.
ABBYY FineReader Professional 10 - volby pro ukládání RTF/DOC/DOCX dokumentů
ABBYY FineReader Professional 10 - nastavení bezpečnostních prvků pro exportované PDF dokumenty
ABBYY FineReader Professional 10 - integrovaný speller umožňuje zkontrolovat text ještě před jeho uložením
ABBYY FineReader Professional 10 - u výběru slovníku pro speller najdeme i podporu uživatelských slovníků MS Wordu
Závěr
FineReader 10 je program na úrovni. Jednoduché ovládání i používání aplikace doplňuje další klad, kterým je sofistikovaný OCR engine, jehož rychlost vynikne především na vícejádrových procesorech. Česká lokalizace grafického rozhraní FineReaderu 10 není k dispozici, s češtinou jako takovou ale program nemá žádné problémy. Převedené dokumenty je občas zapotřebí prohnat ještě spellerem (zejména nadpisy s exotičtějšími fonty), svůj smysl má pak i export dokumentu do MS Wordu a zběžná kontrola gramatiky.
15 denní zkušební verzi FineReaderu si můžete stáhnout zdarma z webových stránek společnosti ABBYY Software. Trial verze je omezena maximem 50 stránek a exportem převedených dokumentů.
ABBYY FineReader Professional 10 - úprava klávesových zkratek pro ovládání aplikace
ABBYY FineReader Professional 10 - doplňková utilita Screenshot Reader k pořizování screenshotů
ABBYY FineReader Professional 10 - Automation Manager slouží k automatizaci prováděných akcí
ABBYY FineReader Professional 10 - součástí vestavěného textového editoru je i funkce na tvorbu hyperlinků
ABBYY FineReader Professional 10 - nastavení stylů textu pro editor a HTML výstup
Tématické zařazení:
-
14. května 2014
Jak vkládat snímky do galerií a soutěží? Stručný obrazový průvodce
-
23. dubna 2014
Konica Minolta přenesla výhody velkých zařízení do kompaktních modelů
-
12. června 2012
-
9. dubna 2014
-
5. ledna 2017
-
6. září 2004
OKI snižuje ceny barevných laserových tiskáren C3100 a C5200n
-
13. května 2004
-
19. ledna 2004
QuarkXPress Passport 6: předvedení nové verze na konferenci Apple Forum 27.1.2004
-
6. února 2001
-
30. listopadu 2014
Nový fotoaparát α7 II: první plnoformát s pětiosou optickou stabilizací obrazu na světě
-
14. října 2024
-
10. prosince 2024