Einstellungen
zum Text
ändere Medientyp
xhtml+xml
ändere Sprache
english
scripting

URI: http://www.j-a-b.net/web/char/char-general
aktualisiert: 2011-08-08
© 2002-2009 Contact

up down
Themenindex

Schriftarten und Zeichensätze

Die folgenden Seiten geben einen kleinen Überblick über die Möglichkeiten, Zeichen zu kodieren, damit sie von Browsern auch korrekt umgesetzt werden. Darüber hinaus wird eine Reihe an vielleicht auf den ersten Blick verwirrenden Begriffen erläutert.

Das www ist ein Netz von Milliarden verlinkter Webseiten in den unterschiedlichsten Sprachen, dessen erste Dokumente in der englischen Sprache verfasst wurden. Hierzu reichte ein sehr beschränkter Umfang an Zeichen aus, die Ziffern 0-9, das lateinische Alphabet mit Klein- und Großbuchstaben, Interpunktion sowie ein paar weitere Zeichen, wie sie im ASCII-Zeichensatz enthalten sind.

Doch schon weit vor Entwicklung des www wurde der Mangel erkannt, dass durch die Beschränkung auf 128 Zeichen, von denen auch noch 33 nicht auf dem Monitor darstellbare Steuerzeichen sind, ein internationaler Informationsaustausch stark behindert würde. So kam es dazu, dass immer mehr Zeichensätze definiert wurden, um den Sonderzeichen einzelner Sprachen Rechnung zu tragen. Auf die Dauer hat dies zu einem sehr verwirrenden Zustand mit hunderten an Zeichensätzen und tausenden an Namen für diese Zeichensätze geführt.

Um eine Möglichkeit zu bekommen, sämtliche existierenden Zeichen heutiger Sprachen in einer einheitlichen Form kodieren zu können, wurde um 1988 herum das Unicode-Projekt entwickelt. Daraus ist mit den Jahren eine Organisation erwachsen, welche in enger Zusammenarbeit mit dem W3C und der ISO mittlerweile die vierte Auflage eines Standards zur Kodierung von Zeichen veröffentlicht hat.

Um Zeichen darzustellen, benötigt man eine Schriftart, welche dem abstrakten Zeichen eine Form gibt. Die Begriffe Zeichensatz und Schriftart werden mitunter durcheinandergebracht. Ein Zeichensatz ist die Zusammenfassung mehrerer abstrakter Zeichen zu einer Gesamtheit. Das Zeichen popup ARABIC LETTER GAF WITH THREE DOTS ABOVE ist beispielsweise Bestandteil des arabischen Zeichensatzes. Zuerst einmal ist es also eine abstrakte Entität, welche beschrieben wird. Diese Entität kann nun kodiert werden, in Unicode ist die entsprechende Kodierung ڴdez bzw. ڴhex. Ein Mensch kann mit diesen Bezeichnungen wenig anfangen, doch der Rechner kann dieses abstrakte Zeichen in eine Darstellung verwandeln, eine Glyphe. Hierzu benötigt er allerdings eine Schriftart, die in der Lage ist, dieses Zeichen auch darzustellen. Je nach der verwandten Schriftart wird dieses Zeichen nun in unterschiedlichen Stilrichtungen in die Glyphe umgewandt. Eine Auswahl unterschiedlicher Glyphen des Zeichens Ä ist in einer Abbildung auf der Seite zur Einführung in Unicode dargestellt.

Tipps: Globale Krankenversicherung

Themenindex

CC logo
Diese Seite ist veröffentlicht unter einer Creative Commons License.