Spracherkennung: Viele Köche verderben den Brei

20.04.2000
Auch wenn immer wieder Billigprodukte in den Retail-Markt gelangen, ist Spracherkennung weit davon entfernt, ein Massenprodukt zu sein. Für Systemhäuser und VARs verheißt der schulungs- und beratungsintensive Markt gutes Geschäft.

Für die Prognose, dass der europäische Markt für Spracherkennung in den nächsten sechs Jahren von 190 Millionen auf knapp 1,7 Milliarden Mark steigen soll, hat Terratec-Produkt-Manager Armin Wensky nur ein müdes Lächeln übrig: "Wieder eine Geschichte aus Forresters persönlicher Märchenstunde." Denn der seit vielen Jahren versprochene Boom ist bisher ausgeblieben: "Am Anfang wurde zuviel Schrott verkauft, weshalb nicht wenige Kunden vergrault wurden. Den Bonus, den die Hersteller bei den Early Adopters verschossen haben, muss erst mühsam zurückgeholt werden." Tatsächlich sind in den ersten Jahren zu viele Produkte von Billiganbietern in den Markt gelangt, die wenig überzeugten.

Übrig geblieben sind trotz immer wieder neuer Versuche einiger Mitspieler als ernsthafte Konkurrenten nur vier: Dragon, IBM, Lernout & Hauspie und Philips. Nach der geplanten 593-Millionen-Dollar-Übernahme des angeschlagenen amerikanischen Unternehmens Dragon Systems durch den belgischen Mitbewerber Lernout & Hauspie werden es sogar nur noch drei sein.

Christiane Herbstritt, Marketing-Managerin bei dem deutschen IBM-Partner Mende, erwartet, dass von Microsoft eine größere Signalwirkung für den Markt ausgeht als von der Superehe mit Dragon Sys-tems. Für Ingram-Macrotron-Produkt-Manager Gerald Haberecker ist der Dragon-Ausverkauf ein deutliches Zeichen, dass der Markt sich konsolidiert, da er nicht groß genug für vier bis fünf Anbieter ist.

"IBM bietet den Vorteil, dass die Lizenzen für Via Voice international erteilt werden, während Dragon sich mit der Politik, für jede Sprache nur eine Lizenz zu vergeben, einfach unflexibel gezeigt hat und den europäischen Markt nicht versteht", schimpft Wensky. Das erklärt vielleicht auch, warum Dragon mit 22 Millionen Dollar Verlust tief in die roten Zahlen gerutscht ist. Terratec hat sich jedenfalls längst von Dragon verabschiedet und setzt für die "Voice Systems" genannten Bundles aus Soundkarte, Headset und Spracherkennungssoftware auf die Via-Voice-Engine von IBM. Auch die für den deutschen Markt verfeinerten Lösungen von Mende einschließlich Spezialthesauri für die Bereiche Medizin, Recht und Wirtschaft basieren auf der Engine von Big Blue. Die Hauptkundschaft sieht Mende in den vertikalen Märkten wie Krankenhäusern, Arztpraxen, Versicherungen, Banken und Chefetagen.

Systemintegrator Quitmann, eine Buhrmann-Tochter, richtet im Rahmen von Projekten deutschlandweit Spracherkennungssysteme ein, erstellt entsprechende Analysen und Konzepte, stellt Fachvokabular zur Verfügung und schult die Mitarbeiter in den Unternehmen. "Ich habe schon Ende der 80er Jahre funktionierende Spracherkennungssysteme erlebt. Aber ohne Schulung kommen die Leute mit der Software einfach nicht zurecht. Denn Sprache ist die Quelle aller Missverständnisse. Deshalb kommt es darauf an, die Texte zu komponieren", betont Hans-Werner Brandes, Prokurist und Vertriebsleiter für den EDV-Bereich bei dem Hanauer Unternehmen.

IBM gibt einen Basistrainingsaufwand von 15 Minuten an. "Das ist Pflicht, und ohne diesen geht es nicht. Hinzu kommen als Kür ungefähr zwei Stunden Vokabularanalyse sowie etwa drei bis vier Stunden Nach-Enrollment", erläutert Wolfgang Karbstein, Leiter der Business-Unit IBM Voice Systems in Böblingen. Den größten Wachstumsmarkt verspricht sich das im Retail starke Unternehmen im professionellen Bereich. Allerdings hat sich, wie Karbstein einräumt, Spracherkennung hier noch nicht so richtig durchgesetzt. Ein Grund hierfür ist, dass es noch vielfach an der Einbindung in Standardanwendungen wie Lotus Notes mangelt. Ein wichtiger Punkt sind auch Makros. Gerade hierin sieht Karbstein auf Systemhäuser und VARs lohnende Aufgaben zukommen.

Mit "Via Voice für E-Business" für die Abfrage von Internet-Inhalten über die Spracheingabe ist der Weg für zukünftige Einsatzgebiete von Spracherkennungssoftware schon geebnet. So schätzt zum Beispiel die Automobilindustrie, dass in den nächsten fünf Jahren 50 Prozent aller PKWs über Spracherkennung den Zugang zum Internet bieten werden. Eine Schwierigkeit ist jedoch das langsame Telefonnetz und dessen Sampling-Rate von nur acht Kilohertz. Die nächste Handygeneration gemäß UMTS (Universal Mobile Telecommunication System), eine verbesserte Software und Hardware sollen hier Abhilfe schaffen.

Auch Terratec-Manager Wensky denkt, dass der Embedded-Markt und Bluetooth neue Impulse für den Markt versprechen. So könnte es in Zukunft möglich sein, mit dem Mobiltelefon sprachgesteuert die Waschmaschine in Gang zu setzten. Doch während für IBM die Zukunft schon im nächsten Jahr beginnt, setzt Wensky den Zeitrahmen konservativer auf "zwei bis fünf Jahre". (kh)

www.ibm.de

www.forrester.com

www.terratec.de

www.speech.de

Zur Startseite