Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

13.08.1982 - 

Spracheingabe Sprachausgabe

Die Vorteile sind schon heute zu sehen, aber:Spracherkennung noch vor dem Durchbruch

Spracherkennung, Sprachverarbeitung, Sprachausgabe: Die Vorstellung vom sprechenden Computer ist keineswegs nur mehr der Science-fiction vorbehalten. Die Zukunft hat bereits begonnen. Es piepst und spricht mit künstlicher (synthetischer) Sprache aus Flippern, elektronischem Spielzeug oder aus der Fahrplanauskunft. Aber zur eigentlichen Kommunikation zwischen Mensch und Computer gehört darüber hinaus auch das gegenseitige verstehen. Hier liegt die eigentliche Problematik dieser Kommunikationskette.

Sprachausgabe und Sprachverarbeitung sind heute bereits weitgehend realisiert. Aber: Kann eine Verbindung zwischen der Sprache des Menschen und der digitalen Informationsverarbeitung des Computers hergestellt werden? Die Antwort: Dem eigentlichen Computer wird ein Spracherkennungssystem vorgeschaltet.

Es besteht aus einem Mikroprozessor, diversen Speichern und Filtern. Die über ein Mikrophon aufgenommene analoge Sprachinformation kann über Filter und ein Zeitraster in digitale Informationen umgesetzt werden. Das System analysiert die Sprache und macht sie für den Computer verarbeitbar. Auf diese Weise ist Sprache zwar aufbereitet, aber Verstehen und daraus resultierendes Handeln setzt außerdem noch ein Erkennen der Information voraus.

Jede Sprache

Das Spracherkennungssystem vergleicht die eingehenden Daten mit einem bereits abgespeicherten, digitalisierten Wortschatz, der ihm während einer Trainingsphase eingegeben wurde. In der Trainingsphase spricht der Benutzer dem System Worte vor, die analysiert und einer bestimmten Funktion zugeordnet werden. Der Computer speichert dann diese digitalisierten Informationen zur späteren Verwendung. Er erkennt jedoch nicht den Sinn der Worte, sondern nur die dazugehörigen Frequenzmuster. Dieses Spracherkennungsverfahren ist auf jede Sprache anwendbar. Es wird als Worterkennung bezeichnet und hat das Problem der Verarbeitung verschiedener Sprachen. Dialekte

Aussprachen überwunden.

Die Spracherkennung mittels der Identifizierung einzelner Buchstaben ist nach wie vor reine Zukunftsmusik. Dieses Verfahren wird, bedingt durch die Wortaussprache, noch einige Zeit auf sich warten lassen oder sich auch als undurchführbar erweisen.

Zukunftsmusik

Wird das Spracherkennungssystem nur von einem Speicher trainiert, so handelt es sich um sprecherabhängige Systeme. Die Zahl der Sprecher kann durch die Speicherung jedes einzelnen Wortschatzes beliebig ausgedehnt werden. Aus diesem Grunde ist die Quote der Erkennungssfehler bei sprecherabhängigen Systemen sehr gering. Sie liegt ein Prozent. Werden mehrere Sprecher zur Wortanalyse herangezogen, so spricht man von sprecherunabhängigen Systemen. Die Erkennungssicherheit dieser Systeme erreicht nicht ganz die Größenordnung der sprecherabhängigen Systeme.

Die verschiedenen Spracherkennungsysteme sind entsprechend den gestellten Anforderungen einsetzbar. So eignen sich sprecherunabhängige Systeme ausgezeichnet für Auskunftsysteme, wie etwa Fahrplanauskunft oder innerbetriebliche Auskunftsysteme. Die sprecherabhängigen Systeme werden sich voraussichtlich mehr Anwendungsbereiche erschließen. Sie sind bereits in der Qualitätskontrolle, der Steuerung von Paketsortieranlagen, als Zugangskontrollen und der Labordatenerfassung in der Anwendung. Vielleicht werden bald auch Fotoapparate, Hi-Fi-Anlagen und Funktionen im Auto durch Sprache gesteuert.

Kommunikationsform Nr.1

Der große Durchbruch hat noch nicht stattgefunden. Aber es ist sicher ratsam, sich mit Spracherkennungssystemen zu beschäftigen, da besonders auf diesem Gebiet mit rasanten und tiefgreifenden Auswirkungen auf den Umgang mit Computern zu rechnen ist. Die zentrale Frage gilt jedoch dem Sinn der Sprachverarbeitung.

Welche Vorteile bringt die Sprachverarbeitung? Ist die Sprache wirklich die dem Menschen angenehmste Kommunikationsform mit dem Computer? Für einige Anwendungen ist diese Frage ohne Vorbehalt positiv zu beantworten. Kann der Benutzer keine Tastaturen bedienen oder müssen die Hände für andere Tätigkeiten freibleiben, dann ist die Sprache die geeignete Kommunikation. Als Beispiele wären hier Qualitätskontrollen, Überwachungsaufgaben auf einem Bildschirm oder die Vermessung von Objekten zu nennen. Die direkte Datenerfassung über die Sprache besitzt in diesen Fällen wesentliche Vorteile.

Fehlerquoten reduzieren

Für andere Anwendungen wird die Frage nach dem Sinn von der höheren Effektivität dieser Systeme beantwortet. Sprachverarbeitungssysteme zeigen sehr wohl Vorzüge gegenüber konventionellen Datenerfassungsmethoden über die Tastatur. Die Fehlerquote der Dateneingabe liegt bei Spracherkennungssystemen wesentlich niedriger als bei manueller Eingabe. Die Summe der erkennbaren Worte ist bisher noch auf etwa 200 begrenzt, wobei sich dieses Limit weiter nach oben hin verschieben wird. Es ist auch zu erwarten, daß die mögliche gesprochene Wortlänge ebenfalls über die bisherigen 1,5 Sekunden hinausgeht. In naher Zukunft, vielleicht schon in einigen Jahren, kann der diktierte Brief direkt vom Drucker ausgedruckt werden. Der Markt für diese Systeme ist bereits vorhanden und wird die nächsten Jahre stark expandieren.

*Waldemar Jantz ist der Marketingabteilung bei der GDV Gesellschaft für elektronische Datenverarbeitung mbH in Tübingen.