äöü-Domains: Experten plädieren für Umstieg von ASCII auf Unicode

25.11.2003
Am 1. März 2004 ist es soweit, dann dürfen Firmen und Privatpersonen in Deutschland, österreich und in der Schweiz Domain-Namen mit Umlauten und Accents registrieren lassen. Bislang darf ein Domainname nur aus 26 Buchstaben, den Ziffern von 0 bis 9 und dem Bindestrich bestehen.

Am 1. März 2004 ist es soweit, dann dürfen Firmen und Privatpersonen in Deutschland, österreich und in der Schweiz Domain-Namen mit Umlauten und Accents registrieren lassen. Bislang darf ein Domainname nur aus 26 Buchstaben, den Ziffern von 0 bis 9 und dem Bindestrich bestehen.

Doch mit der Einführung des neuen Standards IDN (Internationalized Domain Name) wird die Anzahl möglicher Zeichen in Domain-Namen mit der Endung .de und .at nun um 92 erweitert. Schweizer und Liechtensteiner erhalten 31 zusätzliche Zeichen. Als neues Zeichen nicht vorgesehen ist der Buchstabe "ß", denn der ist nach den internationalen Regeln mit dem Doppel-S "ss" identisch.

Die deutsche Registrierungsstelle DENIC nimmt vorab keine IDN-konforme Namenswünsche entgegen, sondern verweist an den jeweiligen Provider. Probleme in der Anfangsphase sind vorprogrammiert, da viele Internet-Anwendungen nicht IDN-fähig sind, die jedoch durch lokale Plugins behoben werden können.

Lokale Plugins werden nach Meinung von Experten nicht ausreichen, um auch im Hinblick auf E-Mail-Dressen das gesamte Domain Name System (DNS) zu internationalisieren. So geht man in China davon aus, dass das steile Wachstum bei der Zahl der Internet- und E-Mail-Adressen nur anhalten könne, wenn die DNS-Kommunikation komplett auf die Berücksichtigung chinesischer Zeichen umgestellt wird.

John Klensin, Ex-Chef des Internet Architecture Board, und etliche andere DNS-Experten plädieren daher für den Umstieg von ASCII auf Unicode auf Basis von UTF-8 (RFC 2277). Viele Anwendungen wie neuere Versionen von Windows, Office, Internet Explorer und Netscape bieten von Hause aus Unicode- und speziell UTF-8-Unterstützung.

Dabei handelt es sich um einen 8-Bit-Zeichensatz, bei dem jedes Zeichen aus einem oder bis zu vier Bytes bestehen kann. In der Abwärtskompatibilität zu ASCII liegt der Vorteil von UTF-8 gegenüber den ursprünglich vom Unicode-Konsortium entwickelten Zeichensätzen:

UTF-16 ist ein 16-Bit- beziehungsweise 2-Byte-Zeichensatz mit 65.536 verschiedenen Zeichen in einem Font. UTF-32 mit 32 Bit oder vier Bytes pro Zeichen bringt es theoretisch sogar auf mehrere Millionen Zeichen in einem Font.

In der aktuellen Version 4.0.0 definiert das Unicode-Konsortium derzeit über 96.000 verschiedene Zeichen aus aller Herren Länder, einschließlich solcher toter Sprachen wie Alt-ägyptisch. (kh)

Zur Startseite