Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

18.10.2002 - 

Programme für die Spracherkennung

"Mikrofon aus, geh schlafen!"

MÜNCHEN (CW) - Vor Jahren galt die Spracheingabe am PC als innovatives und daher heißes Thema. Inzwischen sind die Programme jedoch aus dem Rampenlicht verschwunden. Das Problem liegt indes nicht im Computer, sondern sitzt davor.

Einst scheiterte der Siegeszug der einschlägigen Lösungen für die Konvertierung von Sprache in Text schlicht an der Hardware: Als Grundvoraussetzung musste ein schneller PC mit mindestens 64 MB Arbeitsspeicher zur Verfügung stehen. Vor Jahren war das selbst in Redaktionen der Computerpresse eine Ausnahme. Heute, da bereits Grafikkarten mit 128 MB bestückt sind, hat sich diese Situation komplett gewandelt; dennoch ist es den einschlägigen Anbietern nicht gelungen, einen Paradigmenwechsel einzuleiten und die Tastaturen von den Schreibtischen zu verbannen. Nicht, dass Menschen von Natur aus gerne auf Plastiktasten tippen - die verfügbaren Programme sind ohne langes Training einfach kein adäquater Ersatz.

Dabei sind die Tools inzwischen ausgereift. Nach einer Einarbeitungszeit von 45 Minuten sind "Viavoice 8" von IBM oder "Dragon Naturally Speaking" von Scansoft durchaus in der Lage, über die mitgelieferten Mikrofone simple Sätze richtig zu verarbeiten. Die Überraschung zumindest in der Anfangsphase ist groß; man fühlt sich auf einmal verstanden.

Mit dem "Verstehen an sich" hat dies allerdings weniger zu tun - die Programme registrieren die akustischen Informationen und bilden sie nach bestem Wissen und Gewissen ab. Das wahre Problem sind die Anwender, die sich in der Regel nuschelnd durch die Welt bewegen. Dies wird prompt bestraft: Sagt man "wie", schreibt der Computer "sie". Immer wieder. Intensives Fluchen bringt einen in dieser Situation verständlicherweise auch nicht weiter, da es prompt von der Software dokumentiert wird.

Die Lektionen für das Training der Programme (und vor allem des Anwenders) sind aufwändig gestaltet. Nach einigen Testtexten hat sich der Rechner gemerkt, wie sein Nutzer bestimmte Begriffe auszusprechen pflegt. Danach ist dieses persönliche Profil systematisch zu verbreitern - Fehler dürfen nicht einfach per Tastatur korrigiert, sondern müssen dem Programm beigebracht werden. Diese Kleinarbeit kann lange Zeit dauern und stellt den Nutzer auf eine harte Geduldsprobe.

Fazit: Nach einer Woche regelmäßigen Trainings sollte man in der Lage sein, die umfangreiche Liste der Formatbefehle zu beherrschen. Steuern lässt sich mit den Tools nämlich fast alles, was in Word an Funktionen für die reine Textverarbeitung nötig ist. Darüber hinaus können mit den Programmen auch andere Anwendungen wie "Lotus Notes" oder der "Explorer" bedient werden. Wer Viavoice beherrscht, kann jedoch nicht einfach auf den Dragon umsatteln - die akustischen Anweisungen unterscheiden sich komplett: Mit dem Befehl "Mikrofon aus" lässt sich die IBM-Software deaktivieren; der Dragon hingegen hört auf die Order "Geh schlafen". (ajf)

Die Programme

Viavoice Release 8 Standard

Listenpreis: 40 Euro

www.ibm.de

Vorteil: Woodrow, der sprechende Bleistiftstummel, liest Texte vor.

GUI: Typisch IBM.

Dragon Naturally Speaking XP Standard

Listenpreis: 99 Euro

www.scansoft.de

Vorteil: Bietet keinen animierten Bleistiftstummel, sondern eine Frauenstimme.

GUI: Typisch Microsoft.