Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

16.02.1990 - 

Die Zufallsprosa erinnert stark an das Original

Meisterwerke der Literatur als Vorlage für den Computer *Felix Weber ist Wissenschaftsjournalist in Zürich.

Schwachsinn aus dem Computer - das kann zur Abwechslung auch einmal Spaß machen. Vor allem dann, wenn dieser Schwachsinn aus Daten erzeugt wird, die über jeden Zweifel erhaben sind: Meisterwerken der Literatur. Die Resultate sind überraschend - sie sollten eigentlich die Sprachforscher anspornen, die Sache genauer zu untersuchen.

Die Verwandlung von Literatur in Kauderwelsch vollzieht der Computer in zwei Schritten. Zunächst liest das Programm den Text und ermittelt seine statistischen Gesetzmäßigkeiten. Dabei stellt es zum Beispiel fest, mit welcher Wahrscheinlichkeit ein bestimmter Buchstabe vorkommt, auf einen andern oder auf eine Gruppe von Buchstaben folgt. Im zweiten Schritt erzeugt die Maschine dann einen neuen Text, indem sie gemäß den festgestellten Wahrscheinlichkeiten Buchstaben nach dem Zufallsprinzip aneinanderreiht. So entsteht ein Buchstabensalat, der zwar die statistischen Eigenarten des Originaltextes wiedergibt, aber in der Regel völlig sinnlos ist.

Allerdings wird mit dieser simplen Verwandlung ein höchst charakteristischer Unsinn produziert: Das Ergebnis erinnert nämlich stilistisch in eigenartiger Weise an das Original. Da fragt man sich unwillkürlich: Wie tief geht denn eigentlich das, was wir als Stil eines bestimmten Schriftstellers bezeichnen?

Erzbischof als Pionier der Zufallsprosa

Die Idee, Texte durch zufälliges Zusammenstellen von Buchstaben zu erzeugen, ist nicht neu. Bereits im 17. Jahrhundert machte sich der Erzbischof von Canterbury, John Tillotson, darüber Gedanken. Er erteilte dem Zufall als Sprachschöpfer schlechte Noten: "Wie oft müßte wohl ein Mensch, der die Buchstaben des Alphabets in einem Sack gut durchgeschüttelt hat, diese auf den Boden ausstreuen, ehe sie ein komplettes Gedicht, ja auch nur einen guten Gedanken in Prosa ergäben?"

1927 legte Sir Arthur Eddington nach: "Wenn ein Heer von Affen auf Schreibmaschinen herumklappern würde, könnten sie - vielleicht! - alle Bücher im Britischen Museum schreiben." Er wollte damit unterstreichen, daß dies im Prinzip zwar möglich ist, in der Realität aber nie eintritt: Bis die Affen zum Beispiel nur die ersten neun Worte "To be or not to be, that is the..." aus dem Hamlet-Monolog tippen, hauen sie nach den Regeln der Wahrscheinlichkeitsrechnung im Schnitt Billionen mal Billionen mal Billionen mal Billionen von Buchstaben aufs Papier!

Nun, seit der Zeit Eddingtons hat sich einiges getan. Nicht nur die Affen wurden durch den Computer abgelöst, sondern auch die armen Textkontrolleure, die das Geschreibsel nach vernünftigen Wörtern oder Sätzen durchsehen müssen und dabei ja praktisch nie etwas Brauchbares entdecken. Der Computer ist nicht nur viel schneller, er übertrifft bei entsprechender Programmierung auch die literarischen Fähigkeiten der Affen: So kann er Texte schreiben, bei denen die Buchstaben in gleicher Häufigkeit vorkommen wie in der richtigen Sprache; auch syntaktische Regeln lassen sich ohne weiteres

einprogrammieren.

Interessant wird es aber erst, wenn nicht ein x-beliebiger Zufallstext generiert wird, sondern einer, der auf einem bekannten Original beruht. Was macht die Maschine damit? Das hängt ganz vom Programm ab.

Wenn es die Zeichen für den neuen Text mit der gleichen Häufigkeitsverteilung wie im Original auswählt, sonst aber keine Einschränkungen macht, heißt die Maschine Textgenerator erster Ordnung. Ein solcher produziert zum Beispiel aus einer Passage im letzten Kapitel von James Joyce' "Ulysses" folgenden Zufallstext: "Hud t alonit nta sn tvioet elerfoad pe trltwtl n cabeg tyuemu tigt bh ofdrric o stu hoooto yatndl uya hwae ss nlsdb otrort deerarft d tlff hhare mw ospe ofiot sdoun gt umg h n eaos a sd e tnne pehagiadihnato aatsagi ed inne abra taam gt e twno..."

Das ist natürlich purer Quatsch. Zwar treten die Buchstaben in der richtigen Häufigkeit auf, aber ihre Reihenfolge ist vollkommen willkürlich. Die meisten Wörter sind weder Englisch, noch könnten sie es sein. Nun läßt sich aber das Programm modifizieren: Die Wahrscheinlichkeit, daß ein bestimmter Buchstabe an einer bestimmten Stelle erscheint, soll vom vorhergehenden Buchstaben abhängen (Textgenerator zweiter Ordnung). Zum Beispiel soll auf ein Q ein U folgen, nicht ein Z. Wenn man bei jeder Buchstabenwahl die zwei letzten Buchstaben berücksichtigt (Textgenerator dritter Ordnung), läßt sich bereits die Sprache des Originals feststellen: "May thot to ther yours chim Jose ey eilly jused and hid yel the mark wask trooften herey ling sh thaveres her inced I mea but day wom the eakin wips as sugh the way liarde th my he almaseetir aniciout josindnto grateve no ver bigh wer accow was I goore..."

Die Muster aus Vokalen und Konsonanten sind hier ebenso unmißverständlich wie die charakteristischen Wortwendungen. Treibt man das Spiel weiter (noch mehr vorhergehende Buchstaben berücksichtigen Generatoren vierter und höherer Ordnung), beginnen sogar stilistische Eigenheiten des Originals durchzuschlagen: "The fair Ophelia walk you; I your virtue cannot borne me; for we would beauty, my crown, mine own house. Farwell. Oh, my lord. Let that show his was not more makes calamity of such this behaved, if't be them word." Das ist nicht mehr Joyce, nein, das ist doch - Shakespeare!

Als der deutsche Physikstudent Curt Weber eine Textpassage aus Goethes Faust in den Computer fütterte, kam dabei folgendes heraus (Generator dritter Ordnung):

Habe nun, ich armer auch nun, ach, Philosophie,

Juristerei und bin so klug als wie zuvor.

Da steh ich nun, ich Theologie, Und Medizin,

Da studiert, mit heißem Bemühn.

Juristeh ich nun, ich nun, ach, Philosophie,

durchaus studiert, mit heißem Bemühn.

Und leider Tor.

Allzuweit kann man die Sache allerdings nicht treiben. Erstens wird mit zunehmenden Regeln das Suchprogramm für die Buchstaben immer langsamer, und zweitens nähert sich der neue Text immer mehr dem Original. Am interessantesten sind Generatoren vierter und fünfter Ordnung. Die meisten Buchstabenfolgen verkörpern dann bereits richtige Wörter oder naheliegende Wortverknüpfungen, während das Ganze noch höchst individuell gefärbt ist. Trotzdem lassen sich die "Autoren" an Äußerlichkeiten wie altertümlichen Ausdrücken (Shakespeare) oder Missisippi-Dialekt (Faulkner) leicht erkennen. Selbst Trivialliteratur scheint ihre Eigenheit zu bewahren, wenn man sie durch den Computer läßt. Vielleicht ist sie doch nicht so trivial, wie die Fachleute bisher meinten. +