HTML XML-i: märgistuskeele laiendamine
Suur osa arvutitööstuses tegutsevatest inimestest teab, mis on HTML (hüperteksti märgistuskeel). See on olnud juba pikka aega ja seda on laialdaselt kasutatud ka veebilehtede kujundamisel, kuigi kuigi HTML-i kirjutatud veebilehti on juba harva näha, peetakse seda kogu veebilehtede loomise protsessi põhiteadmisteks.
XML (Extensible Markup Language) on seevastu hilisem ja palju vähem tuntud tehnoloogia, võrreldes HTML-iga. XML loodi 1996. aastal 11-liikmelise grupi poolt SGML-i (standardiseeritud üldistatud märgistuskeel) kohandamiseks kasutamiseks veebis. XML on HTML-iga võrreldes struktureeritum ja rangem märgistuskeel, mis võimaldas kasutajatel luua oma definitsioonid ja modulaarse koodi. Selle eesmärk oli luua standardiseeritud spetsifikatsioonid kohandatud märgistuskeelte, mida nüüd nimetatakse XML-murreteks, loomiseks. See ei pruugi kohe ilmneda, kuid kohandatud märgistuskeeled, nagu HTML, RSS ja Atom, olid kõik ehitatud XML-ist kui meetodit Interneti kasutatavuse suurendamiseks.
Kuna XML on kohandatud SGML-ist, sisaldab see palju koode ja tehnikaid, mis olid algselt pärit SGML-ist, nagu selle rangus ja nn hästi vormistatud. Omadused, mis ulatuvad isegi XML-i järeltulijateni. XML-il põhineva koodi loomisel tuleks alati arvestada teatud reeglitega. Iga dokumendiga on olemas isegi hästi vormistatud deklaratsioon, milles öeldakse, mis tüüpi dokument see on ja millistel reeglitel peaks töötlemine põhinema. See on HTML-is kasutatava väga pingevaba kodeerimisega võrreldes väga erinev.
HTML-i töötlemisel oleks teil mingisugune tulemus, sõltumata sisendist. HTML-protsessor üritab aru saada sellest, mis oli dokumendis, ja loob väljundi, mis tema arvates esindab kõige paremini sisendandmeid. See pole tõsi, kehtib XML-i puhul. XML kasutab veakäsitlusmehhanismi, mida peetakse „drakoniliseks”. Kui XML-protsessor leiab midagi, mida ta ei saa aru, loob ta lihtsalt veateate ja lõpetab faili töötlemise. See jätab teile tõrkekasti ja erinevalt HTML-ist üldse tulemuseta.
Perspektiivselt öeldes on HTML märgistuskeel, mida kasutatakse mingil viisil väljundi kiireks ja hõlpsaks kuvamiseks. See ei puuduta sisendi õigsust ja proovib lihtsalt luua sisendfaili põhjal väljundi. XML on seevastu väga range märgistuskeel, mida tavaliselt sisu loomiseks ei kasutata. Selle peamine kasutamine on abivahend muude märgistuskeelte loomiseks, mis loovad vajaliku sisu.