Extrahování obsahu PDF dokumentů v Adobe Acrobatu a Acrobat Readeru: Obrázky - Grafika.cz - vše o počítačové grafice

Odběr fotomagazínu

Fotografický magazín "iZIN IDIF" každý týden ve Vašem e-mailu.
Co nového ve světě fotografie!

 

Zadejte Vaši e-mailovou adresu:

Kamarád fotí rád?

Přihlas ho k odběru fotomagazínu!

 

Zadejte e-mailovou adresu kamaráda:



skenerista, osvitář

Extrahování obsahu PDF dokumentů v Adobe Acrobatu a Acrobat Readeru: Obrázky

pdf praxe

10. března 2003, 00.00 | V druhé části našeho článku o získávání obsahu z PDF dokumentů se
zaměříme na práci s obrázky.

Jak jsme se pokusili naznačit v první části tohoto článku, přibývá dnes uživatelů, kteří potřebují extrahovat určitý prvek PDF dokumentu pro zpracování v různých aplikacích. V rámci článku jsme se zaměřili na způsoby, jak zmíněné extrahování provést v Adobe Acrobatu, resp. jeho bezplatné, funkčně omezené podobě Acrobat Readeru. Zatímco první část našeho výkladu byla věnována textu, zaměříme se v této části na obrázky.

Co vyžadujeme při extrahování obrázků?

Stejně jako v případě textu se lze i při extrahování obrázků dožadovat nejrůznějších stupňů kvality reprodukce. Základní je přenos přes schránku, přičemž vedle obrazovkového rozlišení, dostačujícího pouze pro účely on-line publikování, bývá častěji vyžadována reprodukce v rozlišení původním, obvykle vyšším. Specifické nároky jsou pak kladeny na hromadné extrahování obsahu jedné či více stránek nebo celého dokumentu a konečně i komplexní převod (např. do HTML podoby), zajišťující umístění obrázků odpovídající původnímu layoutu.

Upozornit zde přitom musíme především na fakt, že výsledek extrahování je bez ohledu na použitý nástroj značně závislý na způsobu, jakým bylo generováno dané PDF. Pokud byl tedy obrázek například ve fázi generování resamplován do nízkého rozlišení, nemáme mnoho možností, jak z daného PDF reprodukovat jeho původní podobu. Řešením zde pak může být pouze dožádání původní předlohy od tvůrce daného dokumentu. Jako v případě textu pak musíme i u obrázků převzatých z jiných zdrojů upozornit na dodržování autorských práv.

Přenos přes schránku

Pro přenos přes schránku lze v Acrobatu i Readeru využít nástroj pro výběr grafiky. Ten umožňuje vybrat tažením zvolený úsek stránky, který pak lze zkopírovat pomocí schránky. Zkopírovaná data ovšem mají rozlišení obrazovky a nejsou tudíž příliš použitelná pro kvalitnější výstup. Navíc se uvedeným způsobem vybírá objekt vizuálně, přičemž původní hranice obrázku (potřebujeme-li je zachytit) v daném dokumentu nejsou zřetelné.

Podstatně lepší možnost nabízí tedy v Acrobatu nástroj pro retušování objektů. Ten umožňuje přímo vybrat daný grafický objekt, který se potom vloží do schránky nebo otevře k editaci v externí aplikaci, přičemž optimální je zde k uvedenému účelu zvolit Adobe Photoshop. (Viz Úpravy-Předvolby-Všeobecné-Retušování). Daný objekt se do prostředí externí aplikace přenese se zachováním svých původních charakteristik (rozlišení, barevný mód atd.) a lze jej tedy uvedeným způsobem exportovat ve velmi věrné podobě.

Nejlepší možnosti přenosu přes schránku nabízí nástroj pro retušování objektů.

Export více obrázků

Výše popsané způsoby přenosu jsou vhodné pouze pro jednotlivé obrázky. Pokud si uživatel přeje naráz automaticky extrahovat obrazové objekty z jedné nebo více stránek PDF dokumentu, může v Acrobatu použít příkaz Soubor-Export-Vyjmout obrazy jako. Ten umožňuje extrahování do formátů JPEG, PNG a TIFF. U každého z těchto formátů lze vyladit charakteristiky, jako je komprese, proklad, barevný prostor či rozlišení (volby zde závisí na typu formátu), případně je také možno ponechat na Acrobatu, aby tyto charakteristiky nastavil resp. převzal automaticky. Extrahování se provede pro celý dokument, chce-li uživatel provést selektivní výběr pouze pro určité stránky (vhodné u rozsáhlejších dokumentů), je pro něj výhodnější s pomocí odpovídajících nástrojů nejprve požadované stránky převést do nového dokumentu a teprve ten extrahovat. (V nabídce Úpravy-Předvolby-Všeobecné-Vyjmout obrazy lze rovněž určit velikost obrázku, pod kterou se extrahování neprovede.)

Exportní dialog pro JPEG.

Export stránek

Do formátů JPEG, PNG a TIFF a mimo to i EPS lze převést nejenom obrazové objekty, ale rovněž celé stránky. (Příkazem Uložit jako.) Takováto forma převodu muže být vhodná například pokud chceme poskytnout on-line náhledy určité části dokumentu anebo potřebujeme část stránky využít k stránkové montáži v layout aplikaci. K druhému z uvedených účelů je daleko nejlepší provést převod do formátu EPS. Ten umožňuje vyladit celou řadu pokročilých parametrů, včetně konverze truetypových písem na postscriptová, nastavení správy barev či průhlednosti aj. (Navíc lze také v rámci zmíněné exportní funkce vybrat k exportu pouze zvolené stránky dokumentu.) K selektování obsahu stránky je možno před extrahováním využít funkci ořezu, k dispozici je dále i funkce rotace. (Viz náš podrobnější výklad zde.)

Nejkvalitnější převod nabízí export do EPS.

Závěrem

Obdobně jako v případě textu musíme i u obrázků konstatovat, že i když Acrobat poskytuje poměrně širokou škálu funkcí pro jejich extrahování z PDF dokumentů, nenalezneme zde takovou funkci, které bychom v současnosti mohli považovat za zcela dopracovanou a univerzálně použitelnou. Uživatelé zde tedy opět často raději sáhnou po aplikacích dalších výrobců, nabízejících (ovšem často za značně vysokou cenu) značně pokročilejší možnosti. Ještě jinou alternativou pro kvalitní načítání obsahu PDF dokumentů do prostředí jiných aplikací zde přitom nabízí importní filtry pre-pressových aplikací, a to zejména těch, které pocházejí od společnosti Adobe.

Tématické zařazení:

 » Rubriky  » Go verze  

 » Rubriky  » Webdesign  

 » Rubriky  » Polygrafie  

 » Rubriky  » PDF - Adobe Acrobat  

 » Rubriky  » Software  

 

 

 

 

Přihlášení k mému účtu

Uživatelské jméno:

Heslo: