Im Unterschied zu Kundinnen

Software versteht schmutzige Witze

20.05.2011

Von

Armin Weiler kümmert sich um die rechercheintensiven Geschichten rund um den ITK-Channel und um die Themen der Distribution. Zudem ist er für den Bereich PCs und Peripherie zuständig. Zu seinen Spezialgebieten zählen daher Notebooks, PCs, Smartphones, Drucker, Displays und Eingabegeräte. Bei der inoffiziellen deutschen IT-Skimeisterschaft "CP Race" ist er für die Rennleitung verantwortlich.

Alle Artikel des Autors

Email: Connect:

Computerwissenschafter der University of Washington haben das erste Softwareprogramm entwickelt, das es versteht, aus Wörtern und Sätzen eine bestimmte Art von Zweideutigkeit herauszulesen, die für das Erzählen von vordergründig schmutzigen Witzen mit sexuellem Anstrich erforderlich ist.

Computer verfügen heute über ein sehr breit gefächertes Spektrum an Features und Funktionen, ein ausgeprägter Sinn für Humor gehört aber sicher nicht dazu. Dies könnte sich jedoch schon bald ändern: Computerwissenschafter der University of Washington haben das erste Softwareprogramm entwickelt, das es versteht, aus Wörtern und Sätzen eine bestimmte Art von Zweideutigkeit herauszulesen, die für das Erzählen von vordergründig schmutzigen Witzen mit sexuellem Anstrich erforderlich ist.

"Wir haben es hier mit einem sehr schwierigen natürlichen Problem der sprachlichen Verständigung zu tun", erklären Chloé Kiddon und Yuriy Brun, Graduate-Studenten der Fakultät für Computer Science & Engineering an der University of Washington gegenüber dem New Scientist. Wenn es darum geht, einem Softwareprogramm beizubringen, was lustig ist und was nicht, würden vor allem Zweideutigkeiten ein Problem darstellen. Diese müssten automatisch erkannt und auf ihren potenziell humorvollen Gehalt hin analysiert werden, fassen die beiden Computerwissenschafter den technischen Aspekt und die zentrale Herausforderung ihrer Arbeit zusammen.

Um ihr Ziel zu erreichen, mussten sich die findigen Programmierer zunächst ausgiebig mit der Analyse von Texten beschäftigen. Für diese Zwecke wurden insgesamt 1,5 Mio. Sätze mit erotischen Inhalten und rund 57.000 Zitate aus Standard-Literaturwerken gesichtet und ausgewertet. Dabei wurde jedem einzelnen der darin enthaltenen Hauptwörter, Adjektive und Verben ein bestimmter "Sexiness-Wert" zugeordnet, der Aufschluss über deren humoristisches Potenzial bei einer zweideutigen Verwendung gibt. Beispielsweise wurden die Wörter "Stange" oder "heiß" mit einem sehr hohen Wert eingestuft.

Das entwickelte System, das Kiddon und Brun "Double Entendre via Noun Transfer" - kurz "DEviaNT" - getauft haben, sollte anschließend selbst dazu in der Lage sein, beliebige Sätze entsprechend ihres möglichen Fun-Faktors zu erkennen und zu werten. Dabei erzielte die Software sehr erfolgreiche Ergebnisse: Den Forschern zufolge konnte das tatsächliche Humorpotenzials in rund 70 Prozent der getesteten Fälle korrekt eingeschätzt werden. "Hätten wir gleichmäßigere Datensätze zur Verfügung gehabt, hätten wir auch 99,5 Prozent erreichen können", sind die Computerwissenschafter überzeugt.

Ob die derzeit noch in der Entwicklung befindliche Technologie jemals als eigenständiges Produkt oder als Teil einer übergeordneten Softwarelösung zur Texterkennung in den Handel kommen wird, lässt sich zum jetzigen Zeitpunkt noch nicht sagen. Kiddon und Brun haben zumindest bereits angekündigt, ihr System weiterentwickeln zu wollen: "Diese Technik kann generalisiert werden, um verschiedene Formen von Zweideutigkeiten und Humor zu erkennen." (pte/haf)

Fachhandel

Per E-Mail versenden

Artikel als PDF kaufen

Über den Autor