Spracherkennungssysteme für den PC

04.03.1998

Der Markt für PC-Spracherkennung ist noch recht übersichtlich. Nur drei Hersteller bieten bereits jetzt oder in Kürze ausgereifte Systeme an. Sie lassen sich grob in solche mit diskreter und kontinuierlicher Sprechweise aufteilen. "Diskret" heißt: langsam, monoton und mit Pausen zwischen den Wörtern sprechen. Die Anbieter versprechen eine Textgenauigkeit von 90 bis 97 Prozent.Die diskrete Variante wird bei IBM durch "Simply Speaking" für 99 Mark inklusive MwSt. abgedeckt. Der Text erscheint in einem Diktierfenster. Komfortabler ist Simply Speaking Gold (149 Mark), bei dem man zum Beispiel in jede Windows-Anwendung sprechen, Diktiermakros erstellen und Fachvokabularien verwenden kann. Die Diktiergeschwindigkeit liegt zwischen 70 und 100 Wörtern pro Minute. Systemseitig sind Windows 95 oder NT, Pentium 100 und 16 MB RAM (32 MB bei NT) gefordert. Bei "Via-Voice" darf der User kontinuierlich sprechen. Es funktioniert mit MS Word 7 und 97, in der Gold-Variante dagegen mit jeder Applikation. Letztere kann per Soundkarte obendrein Texte vorlesen. Via-Voice kostet 249 Mark inkl., Via-Voice Gold 299 Mark. Es ist 125 bis 140 Wörter pro Minute schnell und braucht Windows 95 oder NT 4.0, einen Pentium 150 MMX oder 166 MHz, 125 MB Festplattenspeicher und 32 MB (empfohlen 48 MB) RAM. Alle IBM-Voice-Recognition-Produkte werden mit 30.000 (ausbaubar bis 64.000) Wörtern aktivem und 290.000 Wörtern passivem Vokabular sowie einem Mikrofon ausgeliefert.

Lernout & Houspies Spracherkennungs-Software heißt Voice-Xpress Plus und kommt frühestens im Sommer '98 in einer deutschen Version auf den Markt. Das System läßt sich - anders als beim Wettbewerb - mit intuitiven statt standardisierten Befehlen steuern und liest auch selbst vor. Es arbeitet mit MS Word 7 und 97, ist 140 Wörter pro Minute schnell und hat einen 30.000 Einträge großen aktiven Wortschatz - aufrüstbar bis 60.000. Die Systemvoraussetzungen entsprechen denen von Via-Voice. Der Preis steht noch nicht fest, soll aber bei 200 Mark liegen.

"Naturally Speaking 2.2" von Dragon Systems gibt es in einer Standard- und einer Professional-Version. Die Software unterstützt das Anlegen mehrerer Benutzer, die dann auf einem System diktieren können. Auch hier sind Playback möglich, die sprachgesteuerte Maus und direktes Diktat in nahezu alle Windows-Applikationen. Die Profi-Variante bietet zudem eine Sprachmakro-Funktion und die Möglichkeit, gleich mehrere themenspezifische Wortschätze zu erstellen. Obendrein ist Dragon-Dictate 3.0 enthalten, das die gesamte PC-Steuerung über Sprache ermöglicht. Wortschatz: 50.000 aktiv und 280.000 passiv. Geschwindigkeit: 140 bis 160 Wörter pro Minute. Auch hier entsprechen die Systemerfordernisse denen von Via-Voice, allerdings braucht es nur 60 MB Festplattenplatz. Die Standardversion kostet mit Mikrofon 439 Mark inkl., Profis müssen 1.479 Mark hinlegen. Als Lösung für diskrete Sprechweise bieten die Amerikaner noch Dragon Dictate an, hierzulande über G-Data erhältlich. Neben diesen Allround-Produkten gibt es noch eine Reihe teurer Speziallösungen, zum Beispiel Speechmagic von Philips und Speechbase von SNI für Radiologen. Und nach wie vor gilt: Sprecher und PC müssen einander kennenlernen. Ohne mehrstündige Trainingsphase sind die Resultate mager.

Sorgte auf der CeBIT für Aufsehen: Das Diktiergerät Olympus D1000 mit IBM-Via-Voice-Software speichert mindestens 15 Minuten Text auf Intel-Flash-Memory-Miniaturkarten und überantwortet das Ganze dann per Kabel an den PC. Preis: 800 Mark inklusive MwSt.

Zur Startseite