HTML to XML: Erweiterung der Markup Language
Eine große Mehrheit der Menschen in der Computerbranche weiß, was HTML (Hypertext Markup Language) ist. Es ist schon sehr lange im Web-Design und wird seit langem intensiv eingesetzt, obwohl Webseiten, die nur in HTML geschrieben sind, bereits selten sind, werden sie als grundlegendes Wissen für den gesamten Prozess der Erstellung von Webseiten betrachtet.
XML (Extensible Markup Language) hingegen ist im Vergleich zu HTML eine neuere und weniger bekannte Technologie. XML wurde 1996 von einer Gruppe von 11 Personen als Anpassung von SGML (Standard Generalized Markup Language) für die Verwendung im World Wide Web erstellt. XML ist im Vergleich zu HTML eine strukturiertere und strengere Auszeichnungssprache, mit der Benutzer eigene Definitionen und modularisierten Code erstellen können. Es sollte standardisierte Spezifikationen für die Erstellung von benutzerdefinierten Markup-Sprachen erstellt werden, die jetzt als XML-Dialekte bezeichnet werden. Es ist nicht sofort ersichtlich, aber benutzerdefinierte Auszeichnungssprachen wie HTML, RSS und Atom wurden alle aus XML erstellt, um die Benutzerfreundlichkeit des Internets zu erhöhen.
Da XML von SGML aus angepasst wurde, enthält es eine Menge Code und Techniken, die ursprünglich von SGML stammten, wie etwa die Strenge und die sogenannte Wohlgeformtheit. Merkmale, die sich auch auf die Nachkommen von XML erstrecken. Bei der Erstellung von Code, der auf XML basiert, sollten immer bestimmte Regeln beachtet werden. Zu jedem Dokument gibt es sogar eine wohlgeformte Deklaration, die angibt, um welche Art von Dokument es sich handelt und auf welche Regeln sich die Verarbeitung beziehen soll. Dies unterscheidet sich sehr von der sehr entspannten Codierung, die in HTML verwendet wird.
Wenn Sie eine HTML-Seite verarbeiten, haben Sie unabhängig von der Eingabe ein Ergebnis. Der HTML-Prozessor versucht, den Inhalt des Dokuments zu verstehen, und gibt eine Ausgabe aus, von der er annimmt, dass sie die Eingabedaten am besten repräsentiert. Dies trifft nicht auf XML zu. XML verwendet einen Fehlerbehandlungsmechanismus, der als "drakonisch" betrachtet wird. Wenn der XML-Prozessor auf etwas stößt, das er nicht verstehen kann, erstellt er lediglich einen Fehlerbericht und beendet die Verarbeitung der Datei. Im Gegensatz zu HTML haben Sie also ein Fehlerfeld und kein Ergebnis.
Kurz gesagt, HTML ist eine Markup-Sprache, mit der sich Ausgabearten schnell und einfach anzeigen lassen. Sie beschäftigt sich nicht mit der Korrektheit der Eingabe und versucht lediglich, eine Ausgabe basierend auf der Eingabedatei zu erstellen. XML dagegen ist eine sehr strikte Auszeichnungssprache, die normalerweise nicht zur Erstellung von Inhalten verwendet wird. Sie wird hauptsächlich als Werkzeug zum Erstellen anderer Auszeichnungssprachen verwendet, die den erforderlichen Inhalt erstellen.