Information Technology Reference
In-Depth Information
Man kann ihn sich als elektrische Schreibmaschine vorstellen, die über Tele-
fonleitungen mit anderen Fernschreibern verbunden ist. Tippt man einen
Text in einen der Fernschreiber hinein, dann wird er auf dem gerade ver-
bundenen Gerät ausgedruckt.
Während der Baudot-Code bei den ersten Fernschreibern noch mit fünf Bit
auskam, mündete die ständige Weiterentwicklung in den 1960er Jahren in
einen weltweit genutzten Sieben-Bit-Code, den American Standard Code for
Information Interchange , kurz ASCII. Bei den frühen Computern wurden
Fernschreiber zur Bedienung eingesetzt. So kam es, dass dieser Code, der
ursprünglich gar nicht für Computer entwickelt worden war, noch heute in
jedem digitalen Gerät steckt, ob Computer, Smartphone oder Tablet. So kuri-
ose Zeichen wie »Wagenrücklauf« ( Carriage Return , 0001011) oder das
Auslösen einer Klingel ( Bell , 0000111), mit der am anderen Ende der Lei-
tung die Aufmerksamkeit erregt werden sollte, sind immer noch in ASCII en-
thalten - was eben benötigt wird, um einen Fernschreiber zu steuern.
Weil ASCII auf sieben Bit basiert, können insgesamt 128 Zeichen kodiert
werden (= 2 7 ). Das reicht zwar aus, um die erwähnten Steuerzeichen, Inter-
punktionszeichen, Zifern und die Buchstaben A bis Z in Groß- und Kleinsch-
reibung darzustellen, aber schon die nur im Deutschen verwendeten Buch-
staben »Ä«, »Ö«, »Ü« und »ß« fehlen. Und erst recht fehlen alle nicht-latein-
ischen Schriften: das griechische und das kyrillische Alphabet, die koreanis-
chen und japanischen Silbenschriften oder die chinesischen Logogramme -
Hunderte von Schriftsysteme und Tausende von Sonderzeichen fehlen im
ASCII-Code. Man behalf sich zunächst mit einem achten Bit, durch das noch
einmal 128 Zeichen vergeben werden konnten. Nur hatte das den Preis,
dass die verschiedenen Kodierungen nun in Konkurrenz zueinander traten.
Für asiatische Schriftsysteme wurden sogar ganz neue Kodierungen en-
twickelt. In den 1990er Jahren war die Zeit gekommen, all diese Probleme
zu überwinden und in einem großen Wurf eine einheitliche Kodierung
vorzunehmen. Der Unicode -Standard basierte zunächst auf 16 Bit, später
wurde er auf 32 Bit erweitert. Schon in der 16-Bit-Fassung lassen sich
65.536 Zeichen (= 2 16 ) kodieren, ausreichend für die allermeisten der heute
verwendeten Schriftsysteme und Sonderzeichen. 126 Die meisten Computer
arbeiten mit dieser als UTF-16 bezeichneten Version von Unicode, und auch
der in der Einleitung ermittelte Code für das kleine K ist darin umgesetzt -
ofiziell bezeichnet als »U+006B«. Den allergrößten Teil von UTF-16 nehmen
die chinesischen Schriftzeichen ein, allein zwischen 4E00 und 9FCC inden
sich knapp 21.000 davon. Mit der am Anfang dieses Kapitels beschriebenen
Methode können Sie diese sichtbar machen: Geben Sie beispielsweise 52A3
 
Search WWH ::




Custom Search