PDF/A: archivujte své dokumenty na věčné časy - Grafika.cz - vše o počítačové grafice

Odběr fotomagazínu

Fotografický magazín "iZIN IDIF" každý týden ve Vašem e-mailu.
Co nového ve světě fotografie!

 

Zadejte Vaši e-mailovou adresu:

Kamarád fotí rád?

Přihlas ho k odběru fotomagazínu!

 

Zadejte e-mailovou adresu kamaráda:



Software

PDF/A: archivujte své dokumenty na věčné časy

3. března 2006, 00.00 | Stále více se v poslední době začíná hovořit o formátu PDF/A, tedy upravené podobě PDF,
určené k dlouhodobé archivaci dokumentů. Na jakých principech je daný standard postaven,
jaká je jeho konkrétní podoba a kdy se dočkáme jeho reálného využití?

Pro Portable Document Format (PDF) společnosti Adobe se v posledních letech nachází stále více aplikací. Od platformy pro kancelářské dokumenty a elektronické publikování se postupně přešlo i do oblasti pre-pressu a expanze dále pokračuje. V současnosti se takto nejvíce hovoří o PDF/A, variantě PDF pro archivaci elektronických dokumentů. Cílem tohoto článku je přiblížit uvedený formát našim čtenářům trochu blíže.

K vývoji PDF/A

PDF/A neboli PDF/Archive je jakýmsi "podformátem" formátu PDF, určeným k dlouhodobé archivaci dokumentů, resp. poskytnutí mechanismů, dovolující zachovat vizuální podání dokumentu v průběhu času nezávisle na nástrojích či systémech, které jsou používány k tvorbě, ukládání a renderování dokumentů. Za vývojem PDF/A (který začal v květnu 2002 v USA) jsou zejména NPES (National Printing Equipment Association), AIIM (Association for Information and Image Management) a Administrative Office of the U.S. Courts, dále se na projektu podílí či podílely třeba společnosti Xerox, Harvard University, Adobe, Library of Congress, Honeywell aj. Jak je tedy vidět, jedná se o iniciativu, ve které se spolu stýkají zájmy publikačního průmyslu, státní správy, podniků, kanceláří a obecně vlastně všech oblastí, které mají dnes co do činění s dokumenty.

Myšlenka stojící za PDF/A je inspirována PDF/X, tedy variantou (či přesněji řečeno variantami) PDF, určenými pro bezpečnou výměnu podkladů v publikačním průmyslu, zejména polygrafii. I zde se tedy jedná o snahu použít určité schopnosti stávajících specifikací PDF k danému účelu (zde tedy k archivování), ať už jsou pro dokument v PDF/A povinné, doporučené či povolené, ale také zde vyloučené (resp. zakázané), neboť by byly pro daný účel nadbytečné nebo dokonce škodlivé.

pdfa2f.jpg

Stránky AIIM věnované PDF/A

Podobně jako PDF/X se i PDF/A stal ISO standardem a to poměrně nedávno, v říjnu 2005. Specifikace PDF/A-1 vychází ze specifikace PDF 1.4 (uvedená s Acrobatem 5) a definuje dvě úrovně kompatibility PDF/A-1a a PDF/A-1b, přičemž ta druhá není tolik restriktivní. (V principu tkví základní rozdíl v tom, že PDF/A-1 je postaven na tagovaném PDF, tj. zachovává logickou strukturu dokumentu, což se hodí například při zpracování čtecími zařízeními pro zrakově postižené osoby či přeformátování obsahu dokumentu na displeji PDA.) Povinnou součástí PDF/A dokumentu jsou třeba soubory všech použitých písem, zakázáno je zde naopak například použití průhlednosti či zvuků a videa. Ve vývoji je specifikace PDF/A-2, založená na PDF 1.6 (současná podoba PDF).

Proč PDF/A?

Motivace vedoucí k PDF/A je poměrně jasná každému, kdo někdy potřeboval použít dokument (a je v podstatě jedno, zda hovoříme o dokumentu papírovém či elektronickém) po delší době. Pokud se vůbec podaří daný obsah dohledat, bývají u elektronické podoby často problémy najít aplikaci, ve které se dá dokument otevřít, otázkou pak bývá i vizuální reprezentace dokumentu, která mnohdy neodpovídá původnímu stavu: zobrazení dokumentu totiž obvykle bývá závislé na konkrétním prostředí výrazně více než by se zdálo. Jednoduchým příkladem za všechny nám mohou být dokumenty textových procesorů, které se "rozhodí" třeba již jen při změně tiskového ovladače, klasickým problémem jsou také chybějící písma aj. - uvedené problémy se samozřejmě nevyhýbají ani pre-pressovým aplikacím, mnohdy stačí jen přechod od jedné verze aplikace k vyšší a již je vše "trochu" jinak. Jen enterprise systémy pro správu obsahu pak obvykle dokáží dokumenty archivovat promyšleně, tj. svázat s nimi takové informace, které i po letech umožní zjistit určení dokumentu bez jeho zdlouhavého studia, snadno vyhledat skupinu dokumentů spojených s určitým tématem (klíčová slova) aj. - reálná praxe kanceláří, ale právě třeba i publikačních pracovišť si často vystačí s více či méně vhodným souborovým názvem či odpovídající adresářovou strukturou, což z dlouhodobého hlediska rozhodně nedostačuje. Problémů je pak mnohem více, ale jejich další výčet by byl v našem článku spíše samoúčelný.

Požadavky kladené na PDF/A dokument se snaží obvyklým archivačním problémům předejít. Zásadní je zde především nezávislost na zařízení či softwaru: bez ohledu na to, jaké použijeme, by se měl daný obsah zobrazit vždy stejně. Uvedený požadavek dokáže PDF zajistit velmi dobře již od své první verze, vždyť ostatně k danému účelu (věrná reprezentace obsahu dokumentu bez ohledu na platformu) byl vytvořen. Dalším požadavkem je aby PDF/A soubor byl soběstačný co se požadavků na zobrazení obsahu týče. Konkrétně to tedy znamená, že všechny potřebné komponenty (tedy mimo textu a obrázků především písma) jsou vloženy do něj, informace nejsou odkazovány atd. Dále je PDF/A dokument samovysvětlující, tj. obsahuje v sobě metadata, jež dovolují určit obsah dokumentu, jeho poslání, datum a místo vzniku, autora atd. Rovněž lze v rámci PDF/A zachytit logickou strukturu dokumentu a to s pomocí tagovaného PDF a jazyka XML. Opomenuty konečně nemohou být ani další obecné výhody PDF, především efektivní komprese dokumentů či indexovatelnost a prohledávatelnost textového obsahu.

pdfa1f.jpg

Do PDF lze uložit prakticky jakýkoli dokument. (Převzato z materiálů Adobe.)

Jsou ale i záležitosti, které nasazení PDF/A negarantuje. Archivace znamená především promyšlenou strategii ukládání, použití médií a postupů, které opravdu zajistí dlouhověkost elektronických dokumentů atd. Nikde pak není řečeno, že neexistují situace, kdy je ke stejnému účelu lepší použít jiné technologie, ať už zde uvedeme třeba zavedený bitmapový TIFF či naopak nastupující textový XML: zde bychom se ale dostali do skutečně rozsáhlé diskuse, s kterou bude možná lépe počkat až na dobu, kdy se PDF/A doopravdy dostane do praxe.

Nástroje a výhledy pro PDF/A

Zásadní pro reálné využití standardu je samozřejmě existence příslušných nástrojů. Zde je stav neutěšený, protože v podstatě žádný produkt, jež by PDF/A v jeho současné podobě podporoval, neexistuje. To, co nabídla Adobe v rámci Acrobatu 7 Professional, je pouze podpora pro PDF/A-Draft, tedy specifikaci, která neodpovídá současné ISO podobě. (Ale i tak šlo o zajímavou iniciativu.) Podle všeho by se nicméně stav měl v blízké budoucnosti změnit. Dá se takto předpokládat, že podporu existující specifikace PDF/A poskytnou nové verze publikačních produktů Adobe (minimálně Acrobatu) a se svou do mlýna snad přijdou i výrobci pluginů Acrobatu či nezávislých řešení pro práci s PDF. Svou příležitost zde cítí menší výrobci, když třeba společnosti PDF Tools a LuraTech přišly nedávno s iniciativou PDF/A Center of Competence, jejímž cílem je propagace PDF/A, ale samozřejmě potenciálně i vlastních produktů, které podporu daného standardu nabídnou. A dokonce se pak tvrdí, že ukládání do PDF/A by měla podporovat příští verze Microsoft Office, tedy Office 12.

pdfa3f.jpg

Tvorba PDF/A v Acrobat Distilleru

Závěrem

Jsme skutečně velmi zvědavi, kdy se zde objeví první reálné aplikace pro využití PDF/A v praxi. Nepochybujeme přitom o jejich užitečnosti, i když použití vhodného formátu je jen prvním krokem k dobré archivaci (viz výše) a výhoda daného standardu se už z principu dá dobře ověřit až po delší době. Hrátky s PDF se pak evidentně dostávají do kurzu, když AIIM dnes mimo další verze PDF/A vyvíjí i PDF/UA (podoba PDF určená zejména pro zrakově postižené osoby) a PDF/E (PDF pro reprezentaci technických dokumentů).

Tématické zařazení:

 » Rubriky  » VSE  

 » Rubriky  » Go verze  

 » Rubriky  » Sazba  

 » Rubriky  » Webdesign  

 » Rubriky  » Polygrafie  

 » Rubriky  » PDF - Adobe Acrobat  

 » Rubriky  » Software  

 

 

 

 

Přihlášení k mému účtu

Uživatelské jméno:

Heslo: