Databases Reference
In-Depth Information
Diese Form der Semantik fehlt in XML-Dokumenten. So ist in der Spezifikation
des XML-Standards nicht festgelegt, welche Bedeutung etwa ein Element namens
alben hat. Auch die Toleranz von XML- und HTML-Parsern ist sehr unterschied-
lich: XML-Parser stellen ihre Arbeit beim ersten Fehler im Dokument ein, HTML-
Parser versuchen in aller Regel, selbst noch so inkorrekte Dokumente zu interpre-
tieren.
In vielen Fällen ist Wohlgeformtheit eine zu schwache Anforderung an XML-
Dokumente. Meistens wollen wir das Vokabular und die Struktur eines Doku-
ments vorgeben und dem Anwender dann je nach Anforderungsprofil viel oder
wenig Freiheiten lassen.
Als ein „sauberes HTML“ wurde der Dialekt XHTML definiert. Es genügt der
Syntax von XML und hat die gleiche Semantik wie HTML. In Listing 22.3 finden
wir ein kurzes Beispiel dafür.
Listing 22.3: Ein einfaches XHTML-Beispiel
<html>
<head>
<title>Die Bewohner von Entenhausen
</title>
</head>
<body>
<p>Die folgenden <i>Figuren</i> bevoelkern <b>Entenhausen</b>
</p>
</body>
</html>
Zwar gibt es zu XHTML eine Spezifikation. 2 Doch was nutzt die ganze Spezifi-
kation, wenn jeder XHTML-Autor nach Belieben eigene Tags in die Dokumente
einfügen kann und Parser somit auch Dokumente durchgehen lassen, die nicht
der Spezifikation entsprechen?
Damit das nicht passiert, besteht die Möglichkeit, eine strengere Syntax zu formu-
lieren, als dies alleine mit der Wohlgeformtheit möglich ist. DTD (Document Type
Definition) und XML-Schema sind zwei gängige Sprachen, um XML-Dokumente
zu beschreiben. Beide Schemasprachen haben ihre Stärken und Schwächen, doch
dominiert das mächtige XML-Schema.
Hier wollen wir einen Blick auf die einfachere und weniger komplexe DTD wer-
fen. Dazu formulieren wir ein Beispiel für eine DTD, die XML-Dokumente be-
schreibt, die unserem Beispiel aus Listing 22.2 ähneln. In der folgenden Schema-
definition aus sehen wir, dass es, der hierarchischen Struktur wohlgeformter Do-
kumente entsprechend, genau ein Wurzelelement gibt. In unserem Fall ist dies
reihen .
2
Siehe www.w3.org/TR/xhtml11/
 
Search WWH ::




Custom Search