Fotografický magazín "iZIN IDIF" každý týden ve Vašem e-mailu.
Co nového ve světě fotografie!
Zadejte Vaši e-mailovou adresu:
Kamarád fotí rád?
Přihlas ho k odběru fotomagazínu!
Zadejte e-mailovou adresu kamaráda:
-
30. září 2024
-
4. října 2024
-
14. listopadu 2024
-
11. prosince 2024
skenerista, osvitář
Adobe představila Mars: PDF přepsán do XML
11. prosince 2006, 00.00 | Společnost Adobe uvedla preview své technologie Mars, dovolující komplexně reprezentovat
PDF dokumenty pomocí XML. Znamená daný krok pouhou technickou hříčku nebo začátek nové
etapy využití PDF? O odpověď se pokoušíme v tomto článku.
Před několika dny představila společnost Adobe preview své technologie Mars. Jedná se o formát, a k němu přidružené nástroje, které dovolují obsah PDF dokumentů reprezentovat s pomocí různých dialektů jazyka XML, včetně formátu SVG. Samozřejmě se okamžitě naskýtají otázky, k čemu je takovýto počin dobrý a nakolik je možno skutečně všechny, mnohdy dosti komplikované konstrukty PDF dokumentů, vyjádřit s pomocí XML zápisu. V našem článku hledáme na dané otázky odpovědi.
Základní přiblížení
Veškeré podstatné zdroje týkající se Mars lze najít na serveru Adobe Labs, jenž hostuje preview různých technologií vyvíjených Adobe. V případě Marsu zde máme k dispozici překvapivě bohatou škálu informací a dokonce i prostředků, dovolující daný formát okamžitě vyzkoušet v praxi. Naše seznamování s danou technologií jsme takto začali studiem odpovídajícího FAQ a dále příslušné dokumentace.
Dozvěděli jsme se zde, že Mars je kódové označení pro projekt vyvíjecí XML reprezentaci PDF dokumentů. Struktura PDF souboru je takto v rámci Mars formátu reprezentována s pomocí sady XML souborů - které popisují např. metadata dokumentu, nastavení geometrie stránky, použité odkazy, záložky či skripty aj. - a dále souborů, týkajících se obrázků (soubory v příslušných grafických formátech, jako jsou JPEG, PNG aj.), písem (odkaz na systémová písma, soubory vložených písem), barvových informací (ICC profily, color look-up tabulky), souborových příloh (včetně třeba vložených multimediálních souborů apod.), které jsou dohromady uloženy v podobě balíčku komprimovaného s pomocí algoritmu ZIP.
Struktura Mars dokumentu
Popis jednotlivých stránek - tj. textové informace s údaji o jejich formátování, umístění obrázků a dalších prvků stránky atd. - je pak určen soubory ve formátu SVG. Tam, kde vyjadřovací schopnosti SVG nestačí k zachycení všech fines PDF, jsou pak použita vlastní rozšíření (např. pro "high-end print") - s vývojem daného standardu lze doufat, že dojde k implementování mnohých daných vlastností přímo do jeho specifikace (viz níže). Specifický typ obsahu představují PDF formuláře, k jejichž popisu je v Mars použito dřívější Adobe XML technologie, tedy architektury XFA.
Specifikace Mars je zatím v rozpracované fázi (datum zveřejnění ostré podoby není v tuto chvíli známo), takže i když se podařilo již implementovat řadu vlastností PDF (vychází se dle všeho z PDF 1.6, tj. velmi pokročilé podoby formátu), některé ještě podporovány nejsou. Konkrétně zmiňují stránky Adobe Labs například problémy s vloženou grafikou, některými typy obrázků, písem, výplní či vzorů aj., vůbec zatím není podporováno zabezpečení dokumentů. Zveřejněním specifikace, základních informací pro vývojáře a odpovídajících zkušebních nástrojů se Adobe snaží oslovit nejširší vývojářskou a uživatelskou komunitu, aby k vývoji formátu přispěla. V tuto chvíli ještě není zcela jasné, zda specifikace Mars bude po vytvoření ostré verze stejně veřejně dostupná jako specifikace PDF, dá se to nicméně dost dobře předpokládat.
Nástroje a praktické zkušenosti
Výborné je, že Mars již v této fázi vývoje není jen teoretickým konceptem, ale lze jej prakticky zkoušet a používat. K tomu sloužící nástroje, mající podobu pluginů Adobe Acrobatu 8 Professional a Adobe Readeru 8, si lze stáhnout na stránkách Adobe Labs (připomeňme, že Acrobat 8 je k dispozici i v podobě volně dostupné trial verze, Reader 8 uvolnila Adobe před několika dny). Po instalaci nikterak objemných souborů si může uživatel především Mars dokumenty prohlížet - k testování možností poslouží sada ukázkových dokumentů. Co je pak ale ještě lepší, odpovídající plugin dovoluje v Acrobatu do Mars formátu zvolený PDF dokument uložit, možná je pak i opačná konverze, tj. uložení z Mars do PDF.
Mars dokument otevřený v Adobe Readeru 8
Při prohlížení dokumentů jsme museli obdivovat věrnost podání informací. Většina prvků se mezi PDF a Mars přemapovala naprosto přesně, rozdíly jsme každopádně zaznamenali například v případě vržených stínů, jež se do Mars nepřevedly, i tak byly ale testy provedené na PDF vytvořeném z InDesignu pro tiskovou produkci překvapivě úspěšné.
Z hlediska vnějšího chování Acrobat i Reader fungují s Mars dokumenty stejně jako s dokumenty v PDF, nikde se neobjevují žádná upozornění, speciální prostředí apod. V Acrobatu pak lze u Mars dokumentu provádět stejné úpravy jako v PDF dokumentu, tedy včetně třeba generování interaktivních prvků, preflightu či editace obsahu. Nebyl ani problém uložit Mars dokument i po úpravách zpět do PDF formátu. Žádné z daných zjištění si ovšem netroufáme generalizovat.
Experimentálně jsme ověřili tvrzení, že Mars dokument je v podstatě sada souborů a složek, uložených v ZIP archivu. Zde stačilo změnit příponu dokumentu z mars na zip, standardní nástroje pak dovolily normálně "rozzipovat" výše naznačený typ obsahu. Rozbalily se takto složky odpovídající jednotlivým stránkám dokumentu, kde jsme nalezli XML popis stránky (CropBox apod.), soubory použitých obrázků a dále samotný layout stránky v SVG, který jsme pak bez problémů načetli v open source ilustračním programu Inkscape. Kromě složek pro jednotlivé stránky zde pak jsou složky s údaji o barvách, písmech a metadatech, k dispozici jsou i soubory popisující záložky či jiné interaktivní prvky, hlavní soubor, zachycující strukturu celého balíčku, aj. (viz popis výše) - vše je umístěno srozumitelně a snadno extrahovatelné či upravitelné běžnými nástroji (XML informace v libovolném textovém editoru, ovšem může dojít k narušení validity daného dokumentu, například v případě SVG).
Mars dokument je vlastně ZIP archivem
Využití
Výše uvedený výklad o pohledu do nitra MARS dokumentu naznačuje principiální výhody použití daného formátu namísto normálního PDF. Představuje je především podstatně snazší manipulace s jednotlivými částmi dokumentu, přičemž manuální úpravy jsou samozřejmě nejméně pravděpodobné (ale rovněž možné!), nicméně pro zpracování XML dokumentů i dalšího obsahu uloženého v Mars balíčku existuje nepřeberné množství nástrojů použitelných v programech, aplikacích, ale také třeba při serverovém využití ve webových službách nebo naopak při jednoduchém skriptování publikačních aplikací. Mnohem snáze lze tedy z dokumentu extrahovat určitý typ obsahu (text, obrázky, metadata aj.), nebo obsah upravit či generovat (např. obrázky, přílohy, záložky, odkazy). Dané transformace mohou být i velmi komplexního charakteru a dovolí například připravit různé podoby dokumentu pro různé účely (např. extrahování jednotlivých SVG stránek pro mobilní prohlížeče), zajímavou tématikou je také třeba změna pořadí stránek v dokumentu například při archové montáži či skládání dokumentů ze stránek a dalšího obsahu vytažených z dokumentů dalších. Povšimnout si lze přitom nezanedbatelného faktu, že zpracovávající aplikace může přistupovat vždy pouze k požadovaným komponentám dokumentu, tj. pro zpracování není třeba mít (jako v případě PDF) otevřen dokument celý - to samozřejmě šetří systémové zdroje a zpracování urychluje.
Samozřejmě, něco takového je možné i se samotným PDF (a příslušných nástrojů je celá řada), ovšem znovu je třeba zdůraznit, že manipulace s XML a dalšími komponentami Mars dokumentu představuje obvykle výrazně snazší přístup. Totéž možná ještě větší měrou platí o výrobě dokumentů v Mars formátu: při výstupu z databází a obdobných systémů v podstatě stačí použít libovolný exportní nástroj pro text, který obsah obalí požadovanými tagy, rovněž se takto dají psát filtry pro export z různých aplikací, kapitolou samou o sobě jsou dokumenty generované dynamicky například přes webové rozhraní (že by zde byla nová generace prostředků pro služby typu Web-to-Print?): vývojáři se tedy obejdou bez použití různých PDF knihoven apod. Převod z Marsu do PDF, resp. úpravy Mars dokumentů stejné jako v případě PDF, pak již snadno zajistí nástroje ve stylu výše popsaného pluginu pro Acrobat. Pokud bude mapování vyjadřovacích schopností "PDF:Mars" skutečně v poměru "1:1", bude rozhodně zásadní i schopnost flexibilně "přepínat" mezi Mars či PDF reprezentaci dokumentu v rámci workflow (a využívat pro úpravy PDF dokumentů Mars nástroje či naopak).
Dokument v PDF (vlevo) a jeho vyjádření v Mars formátu (vpravo) po odpovídajícím převodu - kromě stínování nadpisů se zřejmě nic neztratilo
Z toho, co bylo řečeno výše, plynou pro uživatele potenciální výhody, jako jsou zejména velké množství snadno dostupných zpracovávajících nástrojů (včetně výše naznačené možnosti manuálního zpracování), rychlé a na zdroje nenáročné zpracování aj. Použití XML reprezentace dokáže zřejmě garantovat stálost dokumentu v čase, takže Mars může být zajímavý coby formát archivační. A objevují se již i spekulace, že by Mars mohl být pro Adobe "tím správným" formátem pro distribuci eBooků.
Mars a SVG
Uvedení Mars může být potenciálně dobrou zprávou pro příznivce SVG. Stávající vývoj daného formátu zde soustředil pozornost na nasazení na Webu, v poslední době pak ještě více spíše na mobilní platformy. Coby mainstreamový formát pro Web má přitom SVG poněkud nevýhodu v tom, že Adobe s převzetím Macromedia začala opět více sázet na SWF (tj. formát Flashe). Mars znamená, že SVG začíná být pro Adobe opět více zajímavý a daná společnost může více přispět k jeho vývoji. Například již jen výše zmíněná proprietární rozšíření stávající SVG specifikace, vytvořená Adobe v rámci Mars pro tiskovou reprezentaci dokumentu, takto asi pomohou při tvorbě odpovídající části specifikace SVG samotného (SVG Print), a to v podstatě bez ohledu na to, jak samotný Mars dopadne.
Mars versus XPS
Každý, kdo sleduje bedlivěji vývoj ve světě publikačních formátů, asi tuší, že Mars je především odpovědí Adobe na formát Microsoftu XPS (dříve Metro). Jedná se o jakousi alternativu k PDF, založenou na XML (a opět se zde informace ZIPují), kterou Microsoft vyvinul ve spolupráci s firmami jako jsou třeba "renomovaní konkurenti Adobe" Global Graphics, a jež bude přímo podporována ve Windovs Vista a dalších produktech Microsoftu (např. Office). Podle nám dostupných informací jsou vyjadřovací schopnosti XPS slabší nežli v případě PDF, ovšem zásadní je zde pro uživatele skutečnost, že příslušný driver dovolující vytvořit XPS bude zdarma instalován v jejich systému. Pro vývojáře jsou pak určující vlastnosti, které jsme naznačili výše. Chce-li tedy Adobe úplně stáhnout náskok Microsoftu v dané oblasti, musí poskytnout nějakého bezplatného tvůrce Mars dokumentů? Nebo ji bude stačit, když spolehne na vývojářskou komunitu, která ke dnešnímu dni nabízí nepřeberné množství nástrojů pro tvorbu PDF, včetně bezplatných? A nebo má být Mars přinejmenším zpočátku spíše technologií exklusivní, spojenou s publikačními nástroji Adobe (Creative Suite 3)? Obáváme se, že na dané otázky v dnešní době těžko vůbec někdo zná odpověď.
Závěrem
Preview technologie a její reálné uvedení nejsou samozřejmě to samé. Přesto nás Mars hned v náhledové verzi příjemně překvapil a doufáme, že přechod od náhledu k ostré verzi nebude zas až tak dlouhý. Uvidíme, čeho se takto dočkáme v rámci Creative Suite 3, která by se měla objevit již za několik měsíců.
-
14. května 2014
Jak vkládat snímky do galerií a soutěží? Stručný obrazový průvodce
-
23. dubna 2014
Konica Minolta přenesla výhody velkých zařízení do kompaktních modelů
-
12. června 2012
-
9. dubna 2014
-
29. listopadu 2013
-
6. září 2004
OKI snižuje ceny barevných laserových tiskáren C3100 a C5200n
-
13. května 2004
-
19. ledna 2004
QuarkXPress Passport 6: předvedení nové verze na konferenci Apple Forum 27.1.2004
-
6. února 2001
-
30. listopadu 2014
Nový fotoaparát α7 II: první plnoformát s pětiosou optickou stabilizací obrazu na světě
-
14. října 2024
-
22. října 2024
-
14. listopadu 2024
-
10. prosince 2024