Gastkommentar

02.11.1999

Spracherkennung ist eine Technologie, die in den nächsten Jahren in allen Bereichen unseres täglichen Lebens Einzug finden wird. Keinesfalls wird sie andere Benutzerschnittstellen ersetzen, jedoch zweifellos ergänzen. Nämlich dort, wo Spracherkennung ermöglicht, besser, angenehmer oder schneller bestimmte Tätigkeiten zu verrichten oder Informationen zu erhalten.In dem Umfeld konvergierender Märkte (Informationstechnologie, Telekommunikation und Konsumentenelektronik) wird die Spracherkennung die Sichtweise der Anwender und die Benutzungsvielfalt der Produkte revolutionieren. Die Spracherkennungstechnologie hat in den letzten Jahren enorme Fortschritte gemacht und beginnt, stärker in Produkten und Dienstleistungen Einzug zu halten.

Bereits in den nächsten Jahren wird nicht nur die Spracherkennung, sondern auch das natürliche Sprachverstehen, die natürliche Dialogfähigkeit mit einem Computer, ein wirkliches, menschliches Interface bilden: Wir werden mit unserem Arbeitsplatzcomputer sprechen, ihm natürlich gesprochene Anweisungen geben, und er wird diese fehlerlos ausführen. Und nachfragen, sollten die Informationen nicht ausreichen.

Warum sollten wir tippen, wenn wir einfach mit dem Rechner sprechen können? Oder nehmen wir zum Beispiel das Programmieren des Videorekorders, bei dem zum Aufnahmegerät gesprochen wird: "Nehme mir Kommissar Rex am Sonntag auf", und das Gerät versteht, was es tun soll.

Die Technologie wird sich stärker denn je den Erwartungen und Fähigkeiten der Benutzer anpassen, und nicht mehr umgekehrt. Hier liegt der Schlüssel zum Erfolg. Nicht was Spracherkennung kann ist entscheidend, sondern die Art und Weise der Umsetzung. Die besten Technologien sind diejenigen, die der Benutzer nicht bemerkt, wenn er sie verwendet.

Die neueste Generation der Spracherkenner versteht verschiedene Sprachen, Akzente, Dialekte, Ausdrucksformen und Sprechgeschwindigkeiten. Spracherkennungs- und Übersetzungsprogramme werden in Zukunft in Echtzeit eine mehrsprachige Kommunikation ohne menschlichen Übersetzer erlauben, und zwar auch über das Telefon.

Vieles, was gestern noch unmöglich erschien, ist heute Realität. Die Entwicklung der Prozessorrechenleistung schreitet in atemberaubendem Tempo voran. Davon profitiert die Spracherkennungstechnologie in hohem Maße: So können wir größere Erkennungsgenauigkeit und Geschwindigkeit erzielen und den Umfang des Vokabulars ständig erweitern. Wo heute noch sprecherspezifische Anpassungen notwendig sind, werden wir morgen bereits generische Modelle verarbeiten können, die in puncto Erkennungsgenauigkeit die heutigen Möglichkeiten übertreffen werden. Durch automatische Kontexterkennung wird der Spracherkenner automatisch das Referenzsprachmodell benutzen, das er gerade braucht. Das System versteht aus den ersten analysierten Worten, wovon die Rede ist, und erstellt somit weitgehend fehlerlose Texte.

Spracherkennung ist eine technologische Evolution, für uns alle wirkt sie wie eine Revolution - im Arbeitsleben, in der Freizeit, vor allem aber in unseren Kommunikationsmustern. Wer sprechen kann, wird Spracherkennung anwenden - überall.

Ralph Preclik, Director Corporate Communications bei Philips

Zur Startseite