China: 123 Millionen Internet-Nutzer - Wie kommt Chinesisch in den PC?

21.07.2006
Ende Juni 2006 waren in der Volksrepublik China offiziell 123 Millionen Internet-Nutzer registriert worden, zwei Drittel davon mit Breitbandzugang. Mit der Zahl der chinesischen Nutzer mehren sich aber auch Spams aus Ostasien.

Ende Juni 2006 waren in der Volksrepublik China offiziell 123 Millionen Internet-Nutzer registriert worden, zwei Drittel davon mit Breitbandzugang. Mit der Zahl der chinesischen Nutzer mehren sich aber auch Spams aus Ostasien.

Neben Englisch entwickelt sich Chinesisch immer mehr zur meistgenutzten Internet-Sprache. Weit über 1,2 Milliarden Menschen beherrschen schließlich in den unterschiedlichsten Dialekten Chinesisch. Die meisten davon sind in Ostasien zu finden, aber auch in Nordamerika gibt es große chinesische Communities.

Ob Spam oder nicht Spam, Mails aus Ostasien erkennt man meist an einer bunten Aneinanderreihung von Buchstaben und Sonderzeichen. Wer kann und diese oder chinesische Web-Seiten lesen möchte, muss im Internet Explorer oder im E-Mail-System unter Umständen erst die Kodierung beziehungsweise den Zeichenkode ändern. Ein chinesischer Zeichensatz ist natürlich auch nötig.

In China gilt der Guobiao-Code. Guobiao steht für National Standard und umfasst in der Version GB2312 rund 6.760 vereinfachte chinesische Zeichen (Kurzzeichen) plus ein paar hundert Sonderzeichen einschließlich Japanisch und Kyrillisch (Russisch).

Der in Taiwan und Hongkong gebräuchliche Big5-Code bietet dagegen 13.053 traditionelle Zeichen (Langzeichen). Beide Zeichenkodes sind nicht miteinander kompatibel. Das heißt, man muss ebenfalls jeweils die Kodierung ändern, wenn der Text nicht aus China, sondern aus Taiwan kommt. Welcher gemeint ist, erkennt man bei Mails teilweise an dem Vorsatz GB oder Big5.

Beiden Zeichensätzen gemein ist, dass ein chinesisches Zeichen sich aus zwei ASCII-Codes zusammensetzt. Daher das wilde Kuddelmuddel, das bei chinesischen Mails in Europa meist ankommt.

Neben dem GB- und dem Big5-Code etabliert sich auch immer mehr der Unicode, der keinen Unterschied zwischen Lang- und Kurzzeichen macht und bis zu weit über 100.000 unterschiedliche Schriftzeichen einschließlich der aller lebenden und ausgestorbenen Sprachen aufnehmen kann. In China wurde der Guobiao-Code mit GB18030 auf den Unicode angepasst. In der Fassung GB18030-2000 sind 110.000 Zeichen definiert.

Für die Zeicheneingabe nutzen die Chinesen verschiedene Systeme. Das für die meisten Chinesen und Chinesischlernende einfachste Verfahren ist die Eingabe über eine Lautschrift, für die man in China mit der Mandarin-Umschrift "Hanyu Pinyin" noch nicht mal eine chinesische Tastatur braucht.

Andere Eingabemethoden (eingegeben wird über Input Method Editors, kurz IMEs), die teilweise sehr viel schneller sind, aber nur von Profi-Usern wie Sekretärinnen etwa beherrscht werden, nutzen bestimmte Zeichencharakteristika und häufig wiederkehrende Zeichenbestandteile. Dafür braucht man aber eine chinesische Tastatur.

Während früher Zeichen für Zeichen aus einer teilweise endlosen Liste von Möglichkeiten für eine Silbe herausgesucht werden musste, stellen neuere Programme, die auch bei Windows zu finden sind, Algorithmen zur Verfügung, die nach Kontext vorgehen und die jeweils wahrscheinlichsten Zeichenfolgen anzeigen, und dabei muss man noch nicht mal die Töne, bei Mandarin vier bis fünf an der Zahl, mit eingeben.

Die Töne (1. gleichbleibend ausgesprochen, 2. steigend, 3. fallend und wieder steigend, 4. fallend und 5. so genannter Nullton) sind eine Schwierigkeit beim Erlernen von Chinesisch. Je nach Ton verändert sich die Bedeutung. Ein beliebtes Beispiel für die unterschiedlichen Töne ist der Laut "ma". Im ersten Ton kann er "Mama" bedeuten, im zweiten "Hanf", im dritten "Pferd", im vierten Ton "schimpfen" und im fünften oder Nullton ein gesprochenes Frage- oder Ausrufezeichen.

Weitere Schwierigkeit im Chinesischen ist die Lautarmut. Hochchinesisch oder der Mandarin-Dialekt kennt nur etwa 400 verschiedene Silben, mit den Tönen sind es etwa 1.200 bis 1.300. Deutsch dagegen hat mit Fremdwörtern rund 15.000 verschiedene Silben. Allein für den chinesisch Laut "ji" im vierten oder fallenden Ton finden sich in einem größeren Standardwörterbuch über 60 verschiedene Zeichen mit jeweils unterschiedlichen Bedeutungen.

Für Europäer oder Amerikaner kommt noch als Schwierigkeit hinzu, dass "ji" (wie in Jeep), "qi" (wie in cheep), "xi" (wie in Hochdeutsch China) und "chi" (wie in chill), "shi" (wie in ship), "zhi" (dsch) recht ähnlich klingen.

Will man ein unbekanntes chinesisches Zeichen in einem Wörterbuch finden, muss man es über eine Liste von (bei traditonellen Langzeichen) 214 Radikalen oder Grundbausteinen suchen. Die kompliziertesten Radikale mit 16 Strichen sind die für "Drache" und "Schildkröte".

Im nächsten Schritt sucht man das Zeichen unter dem jeweiligen Radikal nach Strichzahlen geordnet. Die kompliziertesten Zeichen haben bis zu 64 Striche. Nach der angegebenen Seite sucht man dann die Bedeutung. Für hochkomplexe Zeichen muss das menschliche Gehirn somit bis zu weit über 70 Rechenschritte bearbeiten. Ein Nebeneffekt: Dabei lernt man auch, sich Zahlen zu merken, denn sonst geht die ganze Suche von vorn los.

Hier ein Beispiel, wie der Kontext-Algorithmus für die Eingabe über die Pinyin-Lautschrift funktioniert: Gibt man "shi" ein, ist das wahrscheinlichste, dass das Zeichen für "ist, sein" angezeigt wird. Folgt nach dem "Shi" aber ein Zähleinheitswort (so wie Laib für Brot oder Glas für Wein), ändert sich das Zeichen für "shi" in das Zahlwort "zehn".

Das "shi" für sein wird in fallendem (4.) Ton ausgesprochen, das "shi" für zehn im steigenden (2.) Ton. Die einfachsten Pinyin-Laute beginnen mit zwei Buchstaben, die längsten wie "shuang" (doppelt) sechs Buchstaben. Muß man auch noch das Tonzeichen mit eingeben, kommt man für ein Zeichen auf drei bis sieben Anschläge, die Suche des Zeichens aus einer Liste von Zig Vorschlägen noch nicht mitgerechnet.

Aber mit all den Erleichterungen für die moderne Eingabe kann man heute einen chinesischen Text relativ flüssig oder sogar fast blind tippen. Gute chinesische Sekretärinnen bringen es mit ihren zeichenbasierten Eingabemethoden auf einen schnelleren Anschlag als deutsche Profis mit Deutsch.

Mehr über Chinesisch und Internet erfährt man unter anderem unter Chinalink.de. Chinesisch-Software vertreiben unter anderem Abitz.com und Ectaco.de. Neuere Windows- und professionelle Word-Versionen bieten aber auch Chinesisch-Unterstützung einschließlich verschiedener IMEs für die Zeicheneingabe. (kh)