Künstliche Intelligenz

Automatisierte Übersetzungen - Möglichkeiten und Grenzen

12.10.2016 von Serena Tirinnanzi
Now we have the salad! Confusio linguarum, auf Deutsch die „babylonische Sprachverwirrung“, kennt jeder. Schließlich war es dieses Ereignis, das zur Entstehung einer ganzen Branche führte. Sprachbarrieren zu überwinden ist seit jeher eines der Grundbedürfnisse in der zwischenmenschlichen Kommunikation. Können Maschinen das besser als wir?
Eine maschinelle Übersetzung eignet sich nicht für alle Texte.
Foto: cybrain - Shutterstock.com

Übersetzer und Dolmetscher ermöglichen es, das zu verstehen, was anderssprachige Menschen sagen und schreiben. Der technologische Fortschritt und der Wunsch des Menschen, Prozesse jeglicher Art zu automatisieren, um profitabler, pragmatischer und schneller zu agieren, führt nun jedoch dazu, den menschlichen Prozess des Übersetzens und Dolmetschens durch künstliche Intelligenz (KI) zu ersetzen.

Wer träumt nicht davon: Morgen wird der Geschäftsbericht an die Aktionäre vorgestellt. Unzählige Seiten voller Fachbegriffe, Zahlen und endloser, verschachtelter Sätze wurden erst heute fertiggestellt. Und morgen schon muss alles auch auf Französisch vorliegen. Die Lösung: Eine durch Algorithmen der künstlichen Intelligenz in Minutenschnelle angefertigte, fehlerfreie maschinell erzeugte Übersetzung, die zudem Kosten und Zeit spart.

Maschinelle Übersetzung – Traum oder Wirklichkeit?

Die Entwicklung der automatisierten Übersetzung hat in den letzten 15 Jahren rasant zugekommen. Egal, in welche Richtung man auch blickt, die „Machine Translation“ hat unseren privaten und beruflichen Alltag erobert: Google Translate, Skype Translator oder Facebook Translate sind nur einige Beispiele.

Seit neuestem soll nicht nur das geschriebene, sondern auch das gesprochene Wort mittels maschineller Übersetzungsprogramme in fremde Sprachen übertragen werden – die Ära des automatisierten Dolmetschens hat begonnen und will sich am Markt etablieren: Das US-Unternehmen Waverly Labs erfand zu diesem Zweck einen kleinen In-Ohr-Kopfhörer namens „Pilot“. Er wird in der Ohrmuschel platziert und soll vollautomatisiert und in Echtzeit in verschiedenen Sprachen dolmetschen. Derzeit unterstützt das Tool die Sprachen Englisch, Spanisch, Französisch, Italienisch und andere romanische Sprachen.

Das hört sich für Laien selbstverständlich spannend an. Schließlich kann es nicht so schwer sein, ein Programm durch korrekte Konfiguration zwischen zwei Sprachen übersetzen zu lassen. Und auch das professionelle Interesse ist durchaus nachvollziehbar, wenn man sich die Zahlen zum weltweiten Übersetzungsmarkt vor Augen führt: Mit 37 Milliarden US-Dollar wurde das Umsatzvolumen des weltweiten Sprachdienstleistungsmarkts beziffert. Bis 2018 soll das Volumen auf 47 Milliarden US-Dollar ansteigen (Quelle: Common Sense Advisory).

Doch was können diese Dolmetscher- und Übersetzungsprogramme wirklich? Sind der „kleine Mann im Ohr“ oder das kostenlose Übersetzungstool tatsächlich in der Lage, für eine mühelose globale Verständigung zu sorgen?

Grenzen heutiger automatisierter Übersetzungs- und Dolmetschersoftware

Was bei der Faszination für automatisierte Übersetzungssoftware allzu oft vergessen wird, ist, dass Übersetzer und Dolmetscher nicht nur eine Eins-zu-Eins-Übersetzung von der einen in die andere Sprache vornehmen, sondern auch „zwischen den Zeilen“ übersetzen. Dazu gehören u.a. die Berücksichtigung kultureller und emotionaler Aspekte wie Humor, Zynismus oder Ironie. Übersetzer und Dolmetscher bauen mit ihrer komplexen sprachlichen Transferarbeit kulturelle und emotionale Brücken, und diese lassen sich nun mal nicht einfach „automatisieren“.

Automatisierte Übersetzungen mit System – regelbasiert oder statistisch

Die Gesetzmäßigkeiten, die hinter einer maschinellen Übersetzung stehen, sollen hier nur am Rande gestreift werden.

Bei der maschinellen Übersetzung wird im Allgemeinen zwischen regelbasierten und statistischen Systemen unterschieden. Erstere verarbeiten Sprache nach linguistischen Regeln: Wörter, Syntax und Grammatik eines Ausgangstextes werden analysiert, klassifiziert und in einem Baumdiagramm abgebildet. Nach der Analyse werden diese Elemente in eine zielsprachige Struktur überführt. Von dort aus wird der Zielsatz generiert. Der technische Aufwand, die natürliche Sprache eines Menschen auf digitale Weise exakt aufzuschlüsseln und in Algorithmen zu beschreiben, ist enorm.

Statistische Methoden sind heute stark verbreitet und weit entfernt von einer Analyse von Syntax, Grammatik und Wörtern. Hier geht es um Wahrscheinlichkeiten für Übersetzungen, die sprachenunabhängig berechnet werden. Muss man bei der regelbasierten Methode auch die Fremdsprache kennen, ist diese für das zweite System nicht relevant. Es dreht sich einzig und allein um Daten, um das Sammeln von Informationen und um Satz- und Wort-Alignierung sowie schließlich um Übersetzungswahrscheinlichkeiten und Sprachmodelle. Das System wird trainiert, sein „Wissen“ stetig ausgebaut.

Einsatzmöglichkeiten für maschinelle Übersetzungen

Schon jetzt wirft diese Skizze zahlreiche Fragen auf: Wie können nach dem derzeitigen Stand der Technik automatische Übersetzungsprogramme mit rhetorischen Figuren wie Humor oder Ironie umgehen bzw. diese adäquat übersetzen? Kann eine Maschine zwischen den Zeilen lesen? Kann sie das überhaupt jemals lernen? Was passiert mit Metaphern und was bei Ambiguität, also bei Ausdrücken mit mehr als einer Bedeutung, aber derselben Laut- bzw. Schriftform wie Bank/Bänke und Bank/Banken? Ist mit „Schlange“ ein Reptil oder eine Menschenschlange gemeint?

Die Feinheiten der menschlichen Sprache sind sowohl kontext- als auch kulturabhängig und daher schwer durch künstliche Intelligenz abzubilden bzw. zu reproduzieren. Das bedeutet aber nicht, dass maschinelle Übersetzungen a priori schlecht sind. Inwieweit eine automatisierte Übersetzung gut werden kann, hängt, so paradox es sich anhört, vom Kontext und von der Kultur ab.

Je weniger Kontext und kulturelle Eigenschaften der Ausgangstext hat, desto eher eignet sich eine automatisierte Übersetzung. Dort, wo einfaches Vokabular, fachliche Wortlisten und hohe terminologische Normierung und eine sachlich-neutrale Sprache vorhanden sind, kann sie durchaus eingesetzt werden. Beispiele hierfür sind Übersetzungen von Bedienungsanleitungen, Protokollen oder Urkunden und Zeugnissen.

Mit Übersetzungs-Apps auf Urlaubs- und Geschäftsreisen
Leo bei Google immer ganz vorn
Leo bietet online in jeweils beiden Richtungen Wörterbücher für Englisch, Französisch, Spanisch, Italienisch, Chinesisch, Russisch, Portugiesisch und Polnisch für allgemeines oder verschiedenes Fachvokabular an. Die Eingabe kann per Tastatur oder Mikrofon erfolgen, je nach Sprache mit mehr oder weniger großem Erfolg oder Frustfaktor. Zur Freeware gehört ein Vokabeltrainer, der die vorherige Eingabe von Zugangsdaten erfordert. Im Leo-Forum kann man sich Rat zu Suchbegriffen holen. Je nach Sprache nimmt der Löwe wie hier bei Russisch ein anderes Aussehen an. Peristroika wird im russischen Teil sogar noch näher erklärt.
Dict.cc mit 51 Sprachpaaren
Dict.cc stellt zwar Englisch und Deutsch 51 Sprachpaare zur Verfügung. Deutsch-Englisch sind es über eine Million Wörter, bei anderen Sprachen nur einige tausend. Eine Besonderheit von Dict.cc ist, dass man die Wörterbücher auch herunterladen kann, um sie offline zu nutzen, eine andere wie hier am Beispiel Computer, dass auf Latein mehrere Übersetzungsmöglichkeiten angezeigt werden. Die Plus-Version von Dict.cc für 5,94 Euro ist werbefrei und bietet zusätzlich Auflistung der zuletzt gesuchten Wörter, Favoritenfunktion und Vokabeltrainer.
Pons mit 12 Millionen Wörtern
Die Wörterbuch-App von Pons ist kostenlos und wurde von androidmag.de 2013 und 2014 zu den besten ihrer Art gekürt. Für einen kleinen Jahresobulus kann man die App auch werbefrei haben. Sie bietet uneingeschränkten Zugriff auf die Übersetzungen des ebenfalls kostenlosen Online-Wörterbuchs des Herstellers und vereint 35 Wörterbücher mit über 12 Millionen Wörtern und Redewendungen in 14 Sprachen.
Pons und der „Da Vinci Code“
Die Online-Wörterbuch-App unterstützt kostenfrei auch die maschinelle Textübersetzung, ein Service, der in der App auch für 23 zusätzliche Sprachen wie Arabisch und Japanisch verfügbar ist. Die Qualität der Übersetzung ist vielfach vergleichbar mit der vom Google Übersetzer. Der Buchtitel „Da Vinci Code“ auf Chinesisch und Arabisch wurde jeweils richtig übersetzt, auch wenn da mal ein Leerzeichen fehlt. Die Spracheingabe über Mikrofon ist auch akzeptabel.
Linguee für ganze englische Phrasen
Linguee ist in der Google-Suche meist ganz vorn, wenn es darum geht, englische oder deutsche komplexe Begriffe und auch ganze Sätze in die jeweils andere Sprachrichtung zu übersetzen. Und sie gibt es auch als App. Diese bietet englisch-deutsch, deutsch-englisch ein sehr umfangreiches Wörterbuch. Darüber hinaus hat man über den Bereich „Linguee.com Web-Resulate“ auch den gewohnten Zugriff auf eine Reihe von Beispielssätzen und weiterführende Informationen aus dem Internet, in dem der gesuchte Begriff oder Satzteil vorkommt. Um den Geldbeutel und die Smartphone-Ressourcen zu schonen, kann man den Zugang zu Linguee.com sperren oder nur über WLAN erlauben.
Multilingualer Google Übersetzer
Zum Google Translator alias Google Übersetzer wurde schon einiges gesagt. Dieser gehört zu den beliebtesten und wohl auch besten Übersetzungs-Apps. Unterstützt werden über 90 Sprachen. OCR (Texterkennung) mit übrigens hervorragender Textausrichtung von Nuance wird nicht für alle Sprachen angeboten, für Arabisch zum Beispiel nicht, wohl aber für Japanisch und Chinesisch. Die Wörter oder Sätze werden in relativ guter Qualität gleich übersetzt und kann man sich auch vorsprechen lassen. Mit Griechisch tut sich die Texterkennung der App manchmal etwas schwer. Aber den russischen Hinweis für Unbefugte verboten wird erkannt.
Japanisch 1a
Dieser japanische Klappentext eines Klassikers über die chinesischen Drei Reiche zeigt die Früchte früher Pionierarbeit japanischer und chinesischer Entwickler. Die Erkennungsgenauigkeit ist sowohl bei den eher eckigen chinesischen als auch bei den runderen japanischen Zeichen hervorragend und oft besser als bei reinen Buchstabenschriften. Der Google Translator scheint nur mit den chinesischen Namen nicht klarzukommen, weil er hier „japanisch“ denkt.
Babylon Translator und Babylon Touch
Vielsprachiges iTranslate
Vielsprachiges iTranslate
Wie der Google Übersetzer versteht sich iTranslate von Sonico Mobile als kostenlose App auf über 90 Sprachen mit Verständnis einzelner Wörter, Phrasen oder ganzer Texte. Man kann den Part eintippen oder aufsprechen. Die Möglichkeit, sich den gesuchten Text in der anderen Fremdsprache vorlesen zu lassen, beinhaltet für Arabisch, Chinesisch, Englisch, Französisch und Spanisch auch unterschiedliche Dialekte. Ein sehr großer Vorteil von iTranslate gegenüber anderen solchen Apps ist der, dass in vielen Fällen mehrere Übersetzungsvorschläge angezeigt werden.
Der mobile Dolmetscher iTranslate Voice
Sonico Mobile hat neben der soeben vorgestellten App auch einen mobilen Dolmetscher entwickelt, der für Englisch und Deutsch in beiden Sprachrichtungen kostenlos ist und über einen kleinen Obolus von 2,99 Euro als Pro-Version für 42 Sprachen und Dialekte geöffnet werden kann. Die App übersetzt den Text nicht nur, sondern liest ihn in der jeweiligen Zielsprache vor. So kann man an seiner eigenen Aussprache arbeiten. Verschiedene Dialekte einzelner Sprachen mit Frauen- oder Männerstimme werden auch unterstützt.
Q Multi Language Translator
Nyxcore bietet neben einem Sprachübersetzer auch den sogenannten Q Multi Language Translator an, der wie bei manchen Bildlexika ermöglicht, sich denselben Begriff oder Satz in mehrere Sprachen übersetzen und vorlesen zu lassen. Die Eingabe kann über die Tastatur oder das Mikrofon erfolgen. Über ein Pluszeichen unten kann man vorher wählen, in welche Sprachen man sich den Part übersetzen lassen möchte. Die Auswahl der möglichen Sprachen ist erstaunlich. Die Übersetzungsergebnisse können sich auch sehen lassen, obwohl sie vielleicht nicht immer grammatikalisch richtig sind. Aber das ist normal.
Babbeln mit Babbel
Der unerfüllte Wunsch, online spielerisch und mühelos spanisch lernen zu können, hat Lorenz Heine erwogen, einen eigenen Vokabeltrainer zu entwickeln, eine Idee, der sich die anderen Co-Gründer spontan anschlossen. Anfang 2008 ist Babbel.com online gegangen und hat heute unter dem Dach der Lesson Nine GmbH mit Sitz in Berlin und mit einem Büro in New York über 300 Mitarbeiter aus 28 Ländern, darunter Sprachwissenschaftler, Muttersprachler und Übersetzer. Ohne den Hintergrund zu kennen, hat sich der Autor dieses Artikels ebenfalls für Spanisch entschieden, um Babbel auszuprobieren. Schließlich kannte man ja schon ein paar Brocken wie „olá“, „gracias“ und „hasta la vista“. Doch selbst bei so einfachen Wörtern ließ der Aussprachetrainer nichts durchgehen. Schön wäre es, an anderer Stelle, manche Übungen wiederholen zu können. Bevor man sich mit den einfachen Vokabeln zu langweilen beginnt, werden einem ziemlich am Anfang plötzlich Sätze entgegengeschleudert, die man kaum versteht, geschweige denn wiederholen kann. Aber wie heißt es so schön: „Nicht fordern ist Faulheit.“ Insgesamt ist die App nur zu empfehlen, weil man das Gefühl hat, schnell Fortschritte zu machen.
50 Languages mit Sprachtrainer
50 Languages bietet, wie der Name schon sagt, eine große Auswahl an Sprachen, die man lernen kann. In dem Sprachführer stehen verschiedene Kategorien zur Auswahl. Die Gratis-App hat allerdings nur 30 Lektionen, für 2,99 Euro kann man zum Beispiel nur Türkçe für Türkisch mit 100 Lektionen erwerben, für 9,99 Euro alle Sprachkurse.

Einsatz von CAT-Tools

Wie aber gehen Übersetzer vor, wenn der Ausgangstext solche Bedingungen nicht erfüllt? Wie können sie den Anforderungen der Kunden nach Schnelligkeit und Preisgünstigkeit gerecht werden? Die Lösung sehen wir in der Anwendung von CAT-Tools. CAT steht für Computer Assisted Translation, einer speziellen Software inklusive Translation Memory System (TMS) und Terminologielisten.

Das Prinzip dahinter: Übersetzer speichern ihre Übersetzung im TMS ab. Wird künftig ein ähnlicher Text übersetzt, vergleicht das System die Segmente im neuen Ausgangstext mit bereits durchgeführten Übersetzungen und zeigt mögliche Treffer an, sogenannte Matches. Es wird nach Ähnlichkeitsgrad unterschieden.

101-prozentige Matches sind „Context matches“ also Segmente, die im alten und neuen Ausgangstext im identischen Kontext eingebettet sind. Bei den 100-prozentigen Matches sind der Inhalt und die Form gleich, der Kontext aber anders. Darunter liegen schließlich die sogenannten Fuzzy Matches (50 bis 99 Prozent Übereinstimmung). Diese sind ähnliche Vorübersetzungen, bei denen allerdings weder der Inhalt noch die Form komplett mit dem neuen Text übereinstimmen.

Der Aufbau eines Translation Memory hat den Vorteil, dass der Übersetzungsprozess immer schneller und effizienter gestaltet wird. Je länger mit einem solchen System – vergleichbar mit dem menschlichen Gedächtnis – gearbeitet wird, desto größer die Datenbank bereits übersetzter Textsegmente, die von vielen Übersetzern folglich zu einem reduzierten Wortpreis berechnet werden.

Grenzen von Translation Memories

Trotzdem: Selbst wenn der Übersetzungsprozess durch den kontinuierlichen Ausbau eigener Translation Memories und bei standardisierten Texten durch den Einsatz von maschinellen Übersetzungen effizienter wird, ist ein menschliches Post-Editing immer notwendig.

Zudem eignet sich auch ein großes Translation Memory nicht für alle Textsorten. Man denke dabei an literarische Texte: Je kreativer ein Schriftsteller in der Schöpfung seines Werkes ist, desto kreativer muss der Übersetzer sein, um in Zielkultur und -sprache die gleiche Wirkung zu erzielen. Der Begriff „Lokalisierung“, der in diesem Zusammenhang für gewöhnlich verwendet wird, schließt diese kulturelle Leistung – die Adaption an den kulturellen, historischen und sozialen Kontext – ein.

Fazit

Funktioniert maschinelle Übersetzung also? Jein. Sie eignet sich zwar für einige wenige Textsorten, wird die menschliche Übersetzungskunst aber vorerst nicht ersetzen können. Maschinen werden sich auch langfristig schwer tun, einen von einem Menschen mit seinen komplexen geistigen Fähigkeiten produzierten Text perfekt an eine spezielle Zielkultur und -sprache anzupassen.

Es käme zwar zu einem Ergebnis, das womöglich den richtigen Inhalt des Ausgangstexts erkennen ließe, auf kontextueller, rhetorischer und emotionaler Ebene aber eher bescheiden ausfiele – und dann hat man den Salat. (PC-Welt)