URI: http://www.j-a-b.net/web/char/char-general
aktualisiert: 2011-08-08
© 2002-2009 Contact
Die folgenden Seiten geben einen kleinen Überblick über die Möglichkeiten, Zeichen zu kodieren, damit sie von Browsern auch korrekt umgesetzt werden. Darüber hinaus wird eine Reihe an vielleicht auf den ersten Blick verwirrenden Begriffen erläutert.
Das www ist ein Netz von Milliarden verlinkter Webseiten in den unterschiedlichsten Sprachen, dessen erste Dokumente in der englischen Sprache verfasst wurden. Hierzu reichte ein sehr beschränkter Umfang an Zeichen aus, die Ziffern 0-9, das lateinische Alphabet mit Klein- und Großbuchstaben, Interpunktion sowie ein paar weitere Zeichen, wie sie im ASCII-Zeichensatz enthalten sind.
Doch schon weit vor Entwicklung des www wurde der Mangel erkannt, dass durch die Beschränkung auf 128 Zeichen, von denen auch noch 33 nicht auf dem Monitor darstellbare Steuerzeichen sind, ein internationaler Informationsaustausch stark behindert würde. So kam es dazu, dass immer mehr Zeichensätze definiert wurden, um den Sonderzeichen einzelner Sprachen Rechnung zu tragen. Auf die Dauer hat dies zu einem sehr verwirrenden Zustand mit hunderten an Zeichensätzen und tausenden an Namen für diese Zeichensätze geführt.
Um eine Möglichkeit zu bekommen, sämtliche existierenden Zeichen heutiger Sprachen in einer einheitlichen Form kodieren zu können, wurde um 1988 herum das Unicode-Projekt entwickelt. Daraus ist mit den Jahren eine Organisation erwachsen, welche in enger Zusammenarbeit mit dem W3C und der ISO mittlerweile die vierte Auflage eines Standards zur Kodierung von Zeichen veröffentlicht hat.
Um Zeichen darzustellen, benötigt man eine
Schriftart,
welche dem abstrakten Zeichen eine Form gibt. Die Begriffe Zeichensatz
und Schriftart werden mitunter durcheinandergebracht. Ein Zeichensatz
ist die Zusammenfassung mehrerer abstrakter Zeichen zu einer Gesamtheit. Das Zeichen
ARABIC LETTER GAF WITH THREE DOTS ABOVE ist beispielsweise Bestandteil des arabischen
Zeichensatzes. Zuerst einmal ist es also eine abstrakte Entität, welche beschrieben wird.
Diese Entität kann nun kodiert werden, in Unicode ist die entsprechende Kodierung
ڴdez bzw. ڴhex.
Ein Mensch kann mit diesen Bezeichnungen wenig anfangen, doch der Rechner kann
dieses abstrakte Zeichen in eine Darstellung verwandeln, eine Glyphe. Hierzu
benötigt er allerdings eine Schriftart, die in der Lage ist, dieses Zeichen
auch darzustellen. Je nach der verwandten Schriftart wird dieses Zeichen nun in
unterschiedlichen Stilrichtungen in die Glyphe umgewandt. Eine Auswahl unterschiedlicher
Glyphen des Zeichens Ä ist in einer
Abbildung
auf der Seite zur Einführung in Unicode dargestellt.
Tipps: Globale Krankenversicherung