HTML and CSS Reference
In-Depth Information
Zeichen-Entities
Zeichen außerhalb des normalen alphanumerischen Zeichen-
satzes wie < und & müssen in HTML- und XHTML-Doku-
menten durch Zeichen-Entities (auch Escape-Sequenzen oder
benannte Zeichen genannt) angegeben werden. In (X)HTML
beginnen Zeichen-Entities mit einem Ampersand-Zeichen
(Kaufmanns-Und,
&
) und enden mit einem Semikolon (
;
). Das
Zeichen selbst kann in Form seiner numerischen Zeichenrefe-
renz (
Numerical Character Reference
, NCR) oder durch einen
vordefinierten Entity-Namen angegeben werden.
Eine numerische Zeichenreferenz bezeichnet das Zeichen
durch dessen Unicode-Codepoint (dezimal oder hexadezimal).
Dezimale Zeichenreferenzen verwenden die Schreibweise
&#[Zahl];
. Hexadezimale Werte werden als »x« wie z.B.
in
&#x[Hex-wert];
angegeben. Das Kleiner-als-Zeichen kann
beispielsweise als
<
(dezimal) oder als
<
; (hexadezi-
mal) angegeben werden.
Zeichen-Entities sind Abkürzungen für bestimmte Zeichen,
wie z.B.
<
für das Kleiner-als-Symbol. Zeichen-Entities sind
in den DTDs für die verschiedenen Varianten von (X)HTML
vordefiniert. Dies ist als Erleichterung für Webautoren
gedacht, weil man sie sich leichter merken kann als die nume-
rischen Zeichenreferenzen.
Der ASCII-Zeichensatz
HTML- und XHTML-Dokumente verwenden den Standard-7-
Bit-ASCII-Zeichensatz im Quellcode. Die ersten 31 Zeichen im
ASCII-Zeichensatz (hier nicht aufgeführt) sind Zeichen zur
Gerätesteuerung, wie Rückschritt (Backspace,
&08;
) und
Wagenrücklauf (Carriage Return,
&13;
) und sind für die Ver-
wendung in HTML-Dokumenten nicht geeignet.
In HTML 4.01 sind innerhalb dieses Zeichenbereichs nur vier
Entities definiert: Kleiner als (
<
,
%lt;
), Größer als (
>
;
>
),
Kaufmanns-Und (Ampersand,
&
,
&
) und das Anführungs-