Fotografický magazín "iZIN IDIF" každý týden ve Vašem e-mailu.
Co nového ve světě fotografie!
Zadejte Vaši e-mailovou adresu:
Kamarád fotí rád?
Přihlas ho k odběru fotomagazínu!
Zadejte e-mailovou adresu kamaráda:
-
30. září 2024
-
4. října 2024
-
14. listopadu 2024
-
11. prosince 2024
Software
Exportní možnosti Adobe Acrobatu 6
acrobat 6 acrobat6
22. prosince 2003, 00.00 | Potřebujete z PDF dokumentu extrahovat text nebo obrázek? Nebo z něj dokonce rychle
vytvořit WWW-prezentaci? Nový Acrobat poskytuje k uvedenému účelu velmi výkonné
nástroje, o jejichž přiblížení se pokoušíme v tomto článku.
Jedním z témat, kterému se na Grafice snažíme průběžně věnovat, je extrahování obsahu z PDF dokumentů. Není divu, neboť uvedený úkol se stává v publikační praxi stále častějším. Různorodostí nároků, vedoucím k potřebě znovu použít informace, uložené v PDF, a především popisem odpovídajících nástrojů, umožňujících daný úkol realizovat v prostředí Adobe Acrobatu 5, jsme se před časem podrobně věnovali v dvojici článků (zde a zde). Nyní je ale k dispozici nová verze zmíněného produktu (Acrobat 6), která pro uvedenou oblast nabízí několik vylepšení a dokonce i nových prostředků. Z tohoto důvodu jsme se rozhodli připravit tento článek, ve kterém se pokusíme nástroje pro extrahování obsahu v novém Acrobatu (resp. jeho počeštěné verzi) přiblížit podrobněji s tím, že informace obecnější povahy, spojené s danou problematikou, dohledá zvídavý čtenář ve výše zmíněných starších článcích.
Přenos obsahu určeného výběrem
Prostředky, sloužící k přenosu obsahu přes schránku či funkcí drag&drop, určeného výběrem přímo v prostředí Acrobatu, nalezne uživatel na nástrojové paletě Základní (a případně z ní extrahované palety Výběr). S aktivovaným nástrojem Vybrat text je možno vybrat k přenosu obsah zvoleného textového úseku (tažením), výřezu (tažení se stisknutou klávesou Alt), stránky (režim zobrazení Jedna stránka) i celého dokumentu (je třeba zapnout zobrazení Průběžně nebo Průběžně-Protilehlé). Pro volbu textu uvedeným způsobem pak lze využít i nástroj Ručička, uživatel ovšem musí provést odpovídající nastavení v předvolbách Acrobatu (Předvolby-Všeobecné).
Paleta nástrojů Výběr.
Nástroj Vybrat tabulku umožňuje vybraný textový úsek převést na tabulku, přičemž výsledek převodu lze přenést do jiné aplikace přes schránku, tažením či odpovídajícím příkazem (Otevřít tabulku v tabulkovém editoru) nebo uložit do souboru v některém z formátů, určeném pro zmíněný typ obsahu (CSV, RTF, HTML, XML tabulka aj. - nabídka je zde podstatně bohatší, než v dřívější verzi Acrobatu). Obdobně nástroj Vybrat obraz dovoluje (tažením či klepnutím) zvolený grafický objekt nejen přenášet přes schránku, ale též uložit do souboru v grafickém formátu (ve Windows to je JPEG a BMP). Pro volbu a přenos či tisk smíšeného obsahu (tedy textu i grafiky) zvoleného na stránce je pak určen nástroj Snímek.
Tabulky lze exportovat do externích souborů.
Jinou možnost přenosu obsahu pak poskytují nástroje pro úpravy obsahu v externí aplikaci. Uživatel si zde v předvolbách (Předvolby-Retušování) musí nastavit požadované aplikace pro grafické i ostatní (textové bloky, vektorové prvky aj.) objekty - nejlepší výsledky garantuje kombinace Photoshop-Illustrator, i když rychlostí a stabilitou zpracování uvedená funkce rozhodně neoslní ani v případě těchto programů. Poté, co jsou externí aplikace nastaveny, může v nich uživatel otevřít objekt, zvolený v prostředí Acrobatu. Po otevření pak lze využít odpovídajících funkcí dané aplikace pro přenos obsahu (schránka, uložení, export).
Hromadné extrahování obrázků
Acrobat rovněž dovoluje hromadně extrahovat veškerou grafiku, obsaženou v daném dokumentu. Po zadání příslušného příkazu (Další volby-Exportovat všechny obrazy) a volbě požadovaného formátu je možno vyladit řadu doplňkových voleb, a to jak těch, které jsou obecně platné (rozlišení, ICC profil pro daný pracovní barevný prostor aj.), tak těch, které jsou specifické pro daný formát (komprese aj.). Nastavit lze také limit velikosti obrázků, které se budou převádět. K dříve podporovaným formátům (JPEG, TIFF, PNG) přitom přibyla možnost uložení obsahu do JPEG2000, nástupce JPEG (JFIF), nabízejícího především vyšší kompresní poměr.
Exportní dialog pro JPEG2000.
Export stránek do obrázkových formátů, PostScriptu a EPS
Výše popsaný převod do obrázkových formátů lze aplikovat i v případě celých stránek (Soubor-Uložit jako), přičemž předvolby jsou obdobné (stále citelně chybí možnost volby stránkového rozsahu, pro který se převod provádí). Dále lze uvedený typ převodu použít i pro formáty PostScript a EPS: zde je možno nastavit řadu pokročilých parametrů, kontrolujících mimo jiné verzi daného formátu, kódování (binární nebo ASCII), rozsah převáděných stránek, vkládání a převody písem, generování náhledů, správu barev, zpracování separací, vykreslení průhlednosti aj. - úzce s uvedenou problematikou souvisí náš dřívější článek o tisku a separacích v novém Acrobatu.
Převod do RTF a textu
Oproti minulé verzi Acrobatu byl vylepšen převod do formátu RTF, použitelného pro přenos obsahu zejména do prostředí textových procesorů (Word aj.). Podrobněji lze nyní kontrolovat zejména vložení obrázků do výstupu, přičemž mimo výstupního formátu (JPEG, PNG) a barevného prostoru lze nastavit i převzorkování obrázků na nižší rozlišení (vhodné zejména u dokumentů, určených původně pro kvalitní tiskový výstup) a vložení poznámek, vytvořených poznámkovým aparátem Acrobatu. Obdobné volby jsou pak k dispozici i pro interní formát Microsoft Wordu DOC.
Nastavení převodu do RTF.
Možné je rovněž uložení obsahu do textového formátu, přičemž lze využít jak převod na holý (plain) text, tak text přístupný. V druhém případě se míní text, určený pro zrakově postižené osoby - do výstupu je zakomponován alternativní obsah, vložený pomocí odpovídajících PDF tagů.
Převod do HTML a XML
Nově je v Acrobatu k dispozici převod PDF dokumentů do formátů HTML či XML. (V Acrobatu 5 bylo možno uvedenou funkci využívat díky volně přístupnému pluginu, jež byl ovšem deklarován pouze jako betaverze.) Otvírá se zde tedy možnost převést zvolený PDF obsah rychle a snadno do podoby, určené pro online publikování, PDA či (v případě XML) další (automatizované) zpracování.
Možnosti převodu jsou poměrně bohaté. V případě HTML lze volit mezi "holým" HTML 3.2 či HTML 4.0, formátovaným pomocí kaskádových stylů (CSS 1.0). U HTML i XML pak lze kontrolovat výstupní kódování textu, generovat záložky a nastavit způsob převodu obrázků (označení externích souborů, formát, převzorkování).
Volby převodu do XML.
Dávkové převody a centrální kontrola nastavení
Za zmínku ještě stojí, že neinteraktivní metody převodu (tedy všechny výše popsané s výjimkou těch, jež jsou prováděny výběrem) lze aplikovat automatizovaně a hromadně s pomocí dávkového procesoru Acrobatu. Uživatel si přitom může nastavit různé dávky, ve kterých má vyladěny určité parametry pro různé podmínky výstupu, což unifikuje proces převodu a snižuje riziko chyb, spojených s manuálním nastavováním parametrů. Ještě jinou možnost centrální kontroly nastavení všech typů převodu poskytuje odpovídající dialog preferencí Acrobatu (Preference-Převod z PDF.).
Závěrem
Možnosti, jak extrahovat obsah z PDF dokumentů, jsou v novém Acrobatu skutečně bohaté a různorodé. Přesto i nadále platí, že kvalitu převodu nejvíce ovlivní samotný PDF dokument, resp. způsob, jakým byl vytvořen: v mnoha případech se tedy nemusíme i s tím nejlepším nástrojem dobrat právě uspokojivých výsledků. Na druhou stranu může být úspěšně provedené extrahování obsahu z PDF dokumentu (i za cenu dílčích úprav) zdaleka nejrychlejší cestou, jak znovu využít dané informace.
-
14. května 2014
Jak vkládat snímky do galerií a soutěží? Stručný obrazový průvodce
-
23. dubna 2014
Konica Minolta přenesla výhody velkých zařízení do kompaktních modelů
-
12. června 2012
-
9. dubna 2014
-
29. listopadu 2013
-
6. září 2004
OKI snižuje ceny barevných laserových tiskáren C3100 a C5200n
-
13. května 2004
-
19. ledna 2004
QuarkXPress Passport 6: předvedení nové verze na konferenci Apple Forum 27.1.2004
-
6. února 2001
-
30. listopadu 2014
Nový fotoaparát α7 II: první plnoformát s pětiosou optickou stabilizací obrazu na světě
-
14. října 2024
-
22. října 2024
-
14. listopadu 2024
-
10. prosince 2024