Message understood? Spracherkennung koppelt Telefon und PC

20.03.1998

MÜNCHEN: Die Erkenntnis, daß die menschliche Sprache seit jeher das wohl effizienteste Kommunikationsinstrument ist, setzt sich jetzt auch in der Computerindustrie durch. Die Entwicklung elektronischer Spracheingabe- und Sprachausgabesysteme wurde in den letzten Jahren forciert, die Qualität marktreifer Produkte ist deutlich gestiegen.Man unterscheidet im wesentlichen zwei Bereiche von CTI-Anwendungen: Der Schwerpunkt der Einsatzbereiche liegt auf der computertechnischen Unterstützung des Anwenders bei der Mensch-zu-Mensch-Kommunikation. Das Anwählen einer Telefonnummer per Mausklick über den PC, oder die Verteilung von Anrufen bei hohem Anrufaufkommen, wie beispielsweise in Call Centern, sind klassische Beispiele dieser horizontalen Art von CTI-Anwendungen.

Eine Vielzahl neuer Einsatzgebiete für CTI-Anwendungen erwarten die Experten zukünftig mit der Nutzung von leistungsfähigen Spracheingabe- und Sprachausgabesystemen. Mit ihnen ist es möglich, spezielle, vertikale Lösungen, basierend auf einer Mensch-zu-Maschine-Kommunikation, zu entwickeln. Das Spektrum möglicher Einsatzbereiche ist breit und reicht von automatischen Telefonzentralen über Voice-Mail, Ansagedienste und komplexen Informationssystemen bis zur Einbindung von Sprachmodulen in Standard-Softwarepakete.

"Wenn Sie mit Ihrem Computer reden, sind Sie nicht verrückt sondern clever." Mit diesem Slogan bewirbt IBM seine neue Spracherkennungssoftware und plädiert damit für den Abbau unbewußter Hemmschwellen. Der PC, der aufs Wort gehorcht. Programme starten, Dateien speichern, Menüs steuern und alles nicht mehr per Tastatureingabe oder Mausklick, sondern auf Zuruf. Spracherkennungssysteme haben in den letzten Jahren dazugelernt. Scheiterten in der Vergangenheit selbst einfache Eingabesteuerungen oft schon an einer undeutlichen Aussprache, ist die Intelligenz moderner Systeme deutlich gestiegen. Erweitert wurde ebenfalls der Funktionsumfang. Beispiele sind die Umwandlung gesprochener Worte in Textdateien und umgekehrt. Briefe nicht mehr schreiben, sondern diktieren, empfangene E-Mails nicht mehr lesen, sondern sich telefonisch auf Anfrage von seinem PC vorlesen lassen, intelligente sprachgesteuerte Telefonzentralen, die gesprochene Sätze nach Schlüsselwörtern durchsuchen und dann Verbindungen herstellen, das sind nur einige Beispiele, die sich mit leistungsfähigen Spracherkennungssystemen realisieren lassen.

Auch Branchenkrösus Microsoft hat offensichtlich die zukünftige Bedeutung sprachgestützter PC-Arbeitsplätze erkannt. Mit einer Beteiligung von 45 Millionen Dollar stieg Microsoft im September 1997 bei Lernout & Hauspie (L&H), einem der weltweit führenden Unternehmen für Sprachtechnologie ein. "In den letzten Jahren hat Microsoft enorme Fortschritte gemacht, die Vision des PCs, der mit seinen Anwendern per Sprache kommunizieren kann, zu verwirklichen.

"Durch die Allianz mit L&H werden wir in der Verwirklichung dieser Vision einen großen Schritt weiterkommen", so Nathan Myhrvold, Microsoft Chief Technology Officer. Er erwartet, daß die Allianz die Entwicklung sprachgesteuerter Anwendungen am Computer deutlich beschleunigen wird.

Fortschrittliche Sprachtechnologie gehört zu den Technologiebereichen mit den höchsten Wachstumsraten. John Oberteuffer, President von Voice Information Associates, ein auf Sprachtechnologien spezialisiertes Marktforschungsinstitut, erwartet bis zum Jahr 2001 für den Bereich der kontinuierlichen Sprache ein Marktvolumen von drei Milliarden Dollar. Das rasante Wachstum wird seiner Meinung nach aufgrund mehrerer Faktoren vorangetrieben:

- Gesprochene Sprache ist die effizienteste und natürlichste Form menschlicher Kommunikation.

- Fortschritte in den Sprachtechnologien.

- Steigende Leistung preiswerter digitaler Signalprozessoren (DSPs) und Mikroprozessoren, die als technologische Grundlage für Sprachtechnologie-Plattformen dienen.

- Weitere Verbreitung, höhere Komplexität und größere Abhängigkeit von elektronischen Geräten

- Explosionsartiges Wachstum des Internet.

Obwohl all diese positiven Rahmenbedingungen gegeben sind, bleibt die letzte Instanz für den Erfolg, beziehungsweise die Akzeptanz von sprachtechnologie-basierenden Anwendungen, der Mensch. (sd)

Jo Lernout und Pol Hauspie zählen seit 1987 zu den Pionieren in der Sprachtechnologie-Entwicklung. Ihr neuestes Projekt ist der Aufbau eines internationalen Technologie-Zentrums in Belgien.

Zur Startseite