Jemný úvod do jazyka XML (I) - Proč právě XML? - Grafika.cz - vše o počítačové grafice

Odběr fotomagazínu

Fotografický magazín "iZIN IDIF" každý týden ve Vašem e-mailu.
Co nového ve světě fotografie!

 

Zadejte Vaši e-mailovou adresu:

Kamarád fotí rád?

Přihlas ho k odběru fotomagazínu!

 

Zadejte e-mailovou adresu kamaráda:

Nabídka práce


Příslušenství

Jemný úvod do jazyka XML (I) - Proč právě XML?

14. září 2001, 00.00 | Dnešním dnem začínáme na Grafice nový seriál věnovaný standardu
XML. První díl je zaměřen na přiblížení vlastností a výhod tohoto
jazyka a jeho srovnání s jinými publikačními standardy.

Úvodem
Jazyk XML se začíná těšit stále větší pozornosti tvůrců i uživatelů informačních technologií. Není divu, neboť podle mnoha předpovědí by se měl záhy stát platformou nového, progresivnějšího stylu práce s elektronickými informacemi. Z uvedeného důvodu jsme se rozhodli připravit malý kurs, seznamující se základy tohoto jazyka, zaměřený především na uživatele pohybující se v oblasti pre-pressu a webdesignu. Našim cílem bude poskytnout znalosti, umožňující orientaci ve světě XML produktů a technologií i využití řešení postavených na uvedené platformě.

První díl našeho přehledu bude věnován obecnému přiblížení vlastností, výhod a možností jazyka XML, a to především formou jeho srovnání s jinými stávajícími publikačními standardy.

Co je XML, jak vznikl a k čemu má sloužit
XML, čili eXtended Markup Language je, jak již název naznačuje, takzvaným značkovacím jazykem. Na rozdíl od programovacích jazyků, které, zjednodušeně řečeno, popisují operace s daty, slouží značkovací jazyky k popisu struktury dat. Obdobně jako jiné značkovací jazyky typu SGML či HTML, o jejichž vlastnostech a vztahu ke XML budeme podrobněji hovořit za chvíli, se jedná o textově založený formát, umožňující zachytit povahu informací pomocí speciálních značek (tzv. tagů).

Tvůrcem XML je XML Working Group, jejíž činnost zaštiťuje konsorcium W3C, kterému vděčíme již za jazyk HTML. Na návrhu XML se začalo pracovat v druhé polovině devadesátých let s cílem vytvořit standard, který by lépe vyhovoval dnešním nárokům na zpracování informací než stávající obdobné formáty. Hlavním dosavadním výsledkem je především specifikace jazyka XML verze 1.0, jejíž první verze byla zveřejněna v únoru roku 1998, zatím poslední pak v říjnu roku 2000.

Své hlavní cíle shrnuli tvůrci XML v následujících deseti bodech:

  1. XML má být široce použitelný na Internetu.
  2. XML má podporovat širokou škálu rozmanitých aplikací.
  3. XML má být kompatibilní s jazykem SGML.
  4. Tvorba programů určených ke zpracování XML dokumentů by měla být snadná.
  5. Množství volitelných vlastností XML by mělo být redukováno na absolutní minimum, ideálně na nulu.
  6. XML dokument by měl být normálně čitelný a přiměřeně jasný.
  7. Návrh XML řešení by měl být rychlý.
  8. Návrh XML řešení by měl metodický a stručný.
  9. Tvorba XML dokumentů by měla být snadná.
  10. Hutnost vyjádření má v XML minimální důležitost.

Uvedený výčet se týče především technických vlastností jazyka, nikoli však jeho výhod v reálném světě výměny informací. Tyto výhody pak v bodech můžeme shrnout následovně:

  • XML je jednoduchým, otevřeným a nezávislým standardem: Samotná specifikace XML není příliš rozsáhlá a je dobře pochopitelná minimálně pro ty, kdo se dříve seznámili s jazykem HTML. Konsorcium W3C zveřejňuje tuto specifikaci prostřednictvím Internetu (odkaz viz výše). Nemá přitom žádné finanční nároky spojené s využitím uvedeného standardu, což samozřejmě akceleruje úsilí vývojářů příslušných aplikací. Snadnému vývoji napomáhá i fakt, že je XML zcela nezávislý na platformě.
  • XML umožňuje dokonalý popis logické struktury dokumentu: XML je navržen tak, aby umožnil co možná nejlépe zachytit strukturu informací a jejich vzájemné vztahy, nezávisle na způsobu jejich zobrazení.
  • XML má od samého začátku široce zabudovánu podporu prakticky všech národních znakových sad: Na konci 90. let mohli tvůrci specifikace XML využít podstatně sofistikovanějších standardů pro reprezentaci národních abeced než kdykoli předtím. Základní znakovou sadou je v XML ISO 10646 používající k reprezentaci znaků 32 bitů, což umožňuje obsáhnout všechny dnes používané národní jazyky.
  • XML je snadno zpracovatelný: Specifikace XML je podstatně přísnější než u jazyka HTML a smysluplně jednodušší než u jazyka SGML (více viz dále), což umenšuje možnost tvorby špatně fungujících XML dokumentů a umožňuje poměrně snadnou tvorbu parserů, tj. aplikací sloužících ke zpracování XML dokumentů.
  • XML je snadno konvertovatelný do jiných formátů: Fakt, že XML preferuje logický popis struktury dokumenty a nabízí průhlednou syntaxi umožňuje relativně jednoduše vytvářet převodníky do stávajících publikačních standardů.
  • XML má šanci se stát univerzálním datovým formátem: Pro všechny i další, v našem výčtu neuvedené výhody, aspiruje XML na to, aby se stal základním formátem pro uchovávání, výměnu a publikování elektronických dat. Jeho podporu dnes přijali za své velcí softwaroví giganti typu IBM či Microsoft, ale rovněž i nezávislá vývojářská komunita.

Srovnání XML s jinými publikačními standardy
K čemu je ale nový, byť mnoha výhodami oplývající formát, když zde máme řadu stávajících a osvědčených standardů, vytvořených k podobnému účelu jako XML? Na tuto otázku se pokusme odpovědět formou malého srovnání, při kterém se zaměříme skutečně jen na ty nejzákladnější publikační standardy dneška.

XML versus SGML
I když název SGML (Standard Generalized Markup Language) vešel v širší známost teprve s nástupem XML, jedná se překvapivě o značkovací jazyk, který je podstatně starší než XML - za ISO standard byl přijat již v roce 1986! A ještě překvapivější může být zcela oprávněné tvrzení, že se jedná o předchůdce dokonalejšího, především co se týče univerzálnosti jeho použití.

Univerzálnost se nicméně stala největším problémem SGML - bylo a stále ještě je obtížné napsat aplikaci schopnou zpracovávat dokumenty v uvedeném jazyce. A tak, i když takovéto aplikace existují, jsou obvykle hodně drahé a náročné na hardware. Přílišná komplexita jazyka klade také značné nároky na tvůrce dokumentů v uvedeném jazyce - obvykle musí jít o profesionály v oblasti informačních technologií, schopné systémového myšlení.

XML byl navržen jako podmnožina SGML, zachovávající si výhody uvedeného standardu při současném rozumném snížení nároků na komplexnost. Je v podstatě jen o něco málo univerzální a flexibilní, nicméně podstatně méně náročný na zpracovávající aplikace i autory dokumentů. To, že je okamžitě použitelný se všemi nástroji vytvořenými pro práci s SGML, umožňuje přitom zachovat dále v chodu řadu velmi komplexních a dobře navržených systémů postavených na SGML.

XML versus HTML
Zatímco SGML je dnešnímu uživateli poměrně neznámý, o jazyku HTML (HyperText Markup Language) to rozhodně říci nelze. Vždyť právě díky tomuto standardu doznalo elektronické, respektive internetové publikování svého současného rozmachu. Jedná se o další, tentokrát skutečně značně jednoduchý klon SGML, využívající několik málo snadno zapamatovatelných tagů, takže tvorba dokumentů je v něm poměrně snadná. S expanzí tohoto jazyka vzniklo nepřeberné množství aplikací podporujících jeho využití, z nichž na prvním místě musíme uvést internetové prohlížeče.

Jednoduchost je nicméně i hlavní slabinou HTML. Značně mu schází možnosti prezentace složitějších formátovacích prvků jako je vícesloupcová sazba, kerning či kontrola prázdného prostoru. Postrádá také možnost definování vlastních tagů, přičemž ty stávající umožňují spíše fyzické (na vzhled zaměřené) nežli logické (na obsah zaměřené) formátování. To jej činí hodně závislým na způsobu podpory v dané zpracovávající aplikaci, což vede k mnoha nekompatibilitám. Na stabilitě mu nepřidává ani řada nestandardních rozšíření, které do něj nezávisle na sobě přidali zejména výrobci hlavních internetových prohlížečů i tvůrci samotné specifikace (HTML dnes existuje již ve čtvrté verzi).

Návrh XML se zrodil především s ohledem na možnosti a omezení HTML. Zachování stávající jednoduchosti, spojené s možností definování vlastních tagů při současně přísnějších syntaktických pravidlech činí z XML jasného a velmi perspektivního následníka HTML. Do doby, než bude podpora XML implementována do stávajících internetových prohlížečů a dalších obdobných řešení, zajišťují koexistování obou standardů především nejrůznější převodníky.

XML versus PDF
Pozornost zaslouží ještě srovnání s dalším rozšířeným publikačním standardem dneška, kterým je formát PDF (Portable Document Format). Ten byl vytvořen společností Adobe s cílem umožnit snadný přenos i těch vizuálně nejsložitějších dokumentů mezi platformami. Postupně začal sloužit nejen potřebám elektronického publikování, ale rovněž pre-pressu. Ke tvorbě i zpracování PDF dnes existuje velké množství aplikací, ať už přímo od Adobe (Acrobat, Distiller, Reader), tak i od nezávislých výrobců. Ty svými schopnostmi i zaměřením pokrývají nejširší spektrum uživatelů a tak je tvorba i publikování PDF snadná a dostupná.

Hlavní nevýhodou PDF je jeho orientace na vizuální zobrazení, nikoli obsah. To v důsledku znamená například problémy při prohledávání a indexování PDF dokumentů, zejména však při potřebě publikovat obsah PDF dokumentu nezávisle na formě. (Typickým problémem, se kterým se PDF, zejména do své poslední verze potýkal, je možnost flexibilního přeformátování dokumentu - tzv. reflow.)

V poslední době nicméně dochází ke stále užší symbióze uvedených platforem. O tu se dnes starají především nejrůznější převodníky, zajišťující převod ve směru XML-PDF. Co je ovšem důležitější, specifikace verzí PDF 1.3 a zejména 1.4 zohledňují strukturaci resp. existenci jazyka XML, a to hned v několika směrech - podrobnější popis je námětem na samostatný článek.

Závěrem
Jak jsme si ukázali v našem přehledu, jazyk XML je navržen s přihlédnutím k možnostem a omezením všech významnějších publikačních standardů dneška. Zatím lze ale těžko předpokládat, že některého ze svých souputníků i ve vzdálenějším časovém horizontu nahradí. Spíše má šanci stát se jakýmsi ústředním formátem, z kterého bude snadné vytvářet podle potřeb dokumenty v některém z ostatních standardů.

Obsah seriálu (více o seriálu):

Tématické zařazení:

 » Rubriky  » Go verze  

 » Rubriky  » Sazba  

 » Rubriky  » Webdesign  

 » Rubriky  » Polygrafie  

 » Rubriky  » PDF - Adobe Acrobat  

 

 

 

 

Přihlášení k mému účtu

Uživatelské jméno:

Heslo: