Freude bei allen Analphabeten und RAM-Herstellern: Spracherkennung ist da!

04.03.1998

HANNOVER: Das Bonmot "PC zum Diktat!" darf mittlerweile getrost als abgeschmackt bezeichnet werden. Die solcherart angepriesenen PC-Spracherkennungssysteme haben sich jedoch von Lachnummern zu ausgereiften Produkten gemausert. Der Durchbruch steht bevor.

Blaukraut bleibt Blaukraut und Brautkleid bleibt Brautkleid." Dem hörenden Computer machen solche Sätze mittlerweile keine Probleme mehr, vorausgesetzt, der Sprecher bringt sie fehlerfrei heraus. In den achtziger Jahren liefen Spracherkennungssysteme noch auf Risc-Basis und funktionierten trotz Preisen weit über 10.000 Mark mehr schlecht als recht. Seit etwa sieben Jahren gibt es Software auch für den PC. Der Durchbruch im Massenmarkt blieb dem PC mit Ohren jedoch versagt. Nur spezielle Berufsgruppen wie Anwälte und Ärzte konnten sich dazu durchringen, ihr eng umrissenes Fachchinesisch in monotoner Robotermanier zu deklamieren.

Für Otto Normalanwender wurde Spracherkennung am Rechner erst durch die Einführung der sogenannten kontinuierlichen Eingabe interessant. Das war im Herbst letzten Jahres. Seither kann der Sprecher endlich reden, wie ihm der Schnabel gewachsen ist, und muß nicht nach jedem Wort eine Pause machen. IBM war die erste, die mit "Via-Voice" eine solche Software vorstellte. Zwar zeigte sich Big Blue bereits mit den Verkäufen der Vorgängerlösung "Simply Speaking" (seit November 1996) zufrieden, jetzt aber will man den Markt richtig aufrollen. In Zukunft soll kein PC mehr ohne Spracherkennung verkauft werden.

Mit der CeBIT startet IBM daher eine Vertriebs- und Marketing-Offensive. Als erstes wird weiter an der Preisschraube gedreht (siehe Kasten). Der Privatanwender soll darüber hinaus über die nagelneue Vobis-Partnerschaft verführt werden (siehe ComputerPartner 5/1998). Der Retailer wird die Aptiva-PCs von IBM mit Via-Voice im Bundle anbieten. "Der Retail-Kanal macht Druck auf das Business-Segment", hofft Wolfgang Karbstein, Leiter des IBM-Geschäftsbereiches Spracherkennung. Die deutliche Mehrheit derer, die mit ihrem PC sprechen, finde sich nämlich im privaten Umfeld. Um die Akquise von Großkunden sollen sich in erster Linie die Best-Team-Partner kümmern. Ein Mailing an alle Lotus-Partner ist unterwegs. Und um den Rest des Unternehmensmarktes kümmern sich zur Zeit rund 45 Fachhändler, von denen Karbstein selbstredend noch mehr an Bord nehmen möchte.

Der aktuelle Preisverfall - man ahnt es - macht das Geschäft für den Handel nicht leichter: "Früher gab es mit Spracherkennungs-Software eine gute Marge. Heute ist mit dem Produkt alleine, und das sage ich allen Partner offen, kein Verdienst mehr zu machen", gesteht Karbstein. Profit winke stattdessen mittels Schulungen und Dienstleistungen. Der mitgelieferte Wortschatz von rund 300.000 reicht nämlich den wenigsten Profi-Anwendern. In den meisten Unternehmen besteht ein Großteil des Gesprochenen aus Fachvokabular. Dies der Software beizubringen, kann sich ein Dienstleister teuer bezahlen lassen, denn die wenigsten Mitarbeiter haben Zeit und Lust, ihren Rechnern tagelang entsprechende Mustertexte vorzubeten; und das bloße Einscannen von Wörterlisten - der kontext-basierten Arbeitsweise sei Dank - bringt nichts. Ein für Unternehmenskunden bislang noch nicht gelöstes Problem ist auch das des Verteilens der Fachvokabularien auf mehrere Arbeitsplätze. Ein entsprechendes Tool befindet sich bei IBM in der Betaphase und soll im Herbst auf den Markt kommen.

Karbstein sieht jedenfalls frohgemut in die Zukunft der Kommunikation zwischen Mensch und Maschine: "Der große Sprung ist durch die kontinuierliche Spreche geschafft. Jetzt kommt nur noch Fein-Tuning, wie etwa sprecherunabhängige Systeme, das Vokabular, die Oberfläche und so weiter. Im Bereich integrierte Lösungen ist noch viel zu tun. Heute sind 90 Prozent der Spracherkennung reine Texterfassung. Unser Ziel sind 20 Prozent", erklärt der Manager. Integration in den Workflow eines Unternehmens, in die Warenwirtschaft, PPS-Systeme, Datenbank-Anwendungen, Help-Desk-Lösungen, CTI-Umgebungen und mobile Geräte: ein weites Feld für findige Hardware-Hersteller, Fachhändler, Software- und Systemhäuser.

Der PC soll den Menschen erlernen und nicht umgekehrt

Auch die Steuerung von Computern durch Sprache macht gewaltige Fortschritte. "Der PC soll uns verstehen, nicht umgekehrt. Die Menschen wollen nicht eine Latte von Befehlen auswendig lernen und exakt wiedergeben. Es muß egal sein, ob jemand sagt: ,Bitte den zweiten Absatz markieren und fett machen und anschließend druckenÈ, oder ,Absatz zwei fett und AusdruckÈ oder irgendetwas anderes", fordert Karbstein. Einer seiner Konkurrenten ist hier schon einen Schritt weiter. Die Lernout & Houspie Speech Products N.V. bietet in ihrer Diktierlösung "Voice-Xpress Plus" genau das. Das belgische Unternehmen kann sich zudem einer weitreichenden Kooperation mit Microsoft rühmen. Der Software-Gigant kaufte sich für 45 Millionen Dollar L&H-Anteile. Ziel: Die Spracherkennung soll in den kommenden Jahren fester Bestandteil von Windows werden. In Sachen Marketing und Vertrieb hinkt L&H dem Mitbewerb hierzulande noch etwas hinterher, von Lizenzvereinbarungen mit Hitachi, Acer und der Deutschen Telekom einmal abgesehen. Die erste deutsche Version ihrer Software bringen die Belgier erst im Sommer auf den Markt, und auch eine Dependance für den hiesigen Markt ist nur in Planung. Ein As im Ärmel der im flandrischen Ieper beheimateten Firma ist eine Browser-Software, die fremdsprachige WWW-Inhalte übersetzt.

Dritter im Bunde der ernstzunehmenden Anbieter von PC-Spracher-kennungs-Software ist Dragon Systems Inc. Auch die Amerikaner verkaufen seit letztem Herbst eine Diktierlösung für kontinuierliches Sprechen: "Naturally Speaking" ist in Deutschland unter dem Namen Smart-Word vor allem durch den OEM-Partner Terratec bekannt. Die 1982 gegründete Dragon vermarktete ihre Produkte in Deutschland bis 1994 über die IBM. Zur gleichen Zeit kam das Unternehmen mit einer ersten Diktier-Software für Windows auf den Markt. Den Weg von der Nischen- zur Massenanwendung schlägt Dragon aber - ähnlich wie IBM - erst jetzt ein, da die Software in Preis und Handhabung endlich für den normalen User interessant wird. Dadurch wird auch für den Anbieter aus Neuengland der Retail-Kanal immer wichtiger. In den Mitnahmemärkten will Dragon seine Lösung nun auch unter eigenem Namen an den Käufer bringen. Die bislang 50 autorisierten Fachhändler dürfen sich also auf zunehmende Konkurrenz freuen - inklusive deren Lieferant Macrotron: Weitere Distributoren sind in Sicht.

Große Hoffnungen setzt Vertriebs- und Marketing-Beauftragte Anke Conzelmann zudem in die Ende Februar vereinbarte Kooperation mit Corel: "Naturally Speaking wird in Word-Perfect integriert. Die deutsche Version der Suite inklusive Spracherkennung kommt noch in diesem Jahr", verspricht die Münchnerin, bei deren Arbeitgeber der Speicherhersteller Seagate 25 Prozent der Anteile hält. Teilt man den Enthusiasmus der Anbieter, dann gibt es beim Thema Spracherkennung für jedermann eigentlich nur zwei Verlierer: Menschen, die ihr Geld mit Schreibarbeiten verdienen und die Prozessorhersteller, die ständig auf der Suche nach rechenintensiven Anwendungen sind: "Bei mir war gestern jemand von Intel", berichtet IBM-Mann Karbstein schmunzelnd von einer CeBIT-Begegnung. "Der wollte wissen, ob man für Spracherkennungs-Software mehr Rechnerleistung braucht. Nein, habe ich gesagt, Arbeitsspeicher ist viel wichtiger." (ld)

"Leider müssen wir künftig auf Ihre Mitarbeit verzichten." Per Mikrofon statt Tastatur gehen einem Manager solche Sätze gleich viel leichter über die Lippen.

Geht beim Vertrieb in die Breite und zu Corel: Anke Conzelmann, zuständig für Vertrieb und Marketing bei der Dragon Systems GmbH.

"Wir sollten öfter miteinander reden", appelliert Wolfgang Karbstein, Leiter der IBM-Spracherkennung, an seinen PC.

Zur Startseite