Retail- und Consumermarkt tragende Säulen

02.11.1999

MÜNCHEN: IBM stellte als einer der ersten Hersteller bereits 1984 sein erstes Spracherkennungssystem vor, das mit Hilfe eines Großrechners in einem mehrere Minuten dauernden Rechenvorgang etwa 5000 englische Einzelwörter erkennen konnte und bezeichnet sich auch als Vorreiter für Massenprodukte im Bereich Spracherkennungssoftware. ComputerPartner-Redakteurin Marzena Fiok sprach mit Wolfgang Karbstein, dem Leiter des Geschäftssegments Spracherkennung bei Big Blue.Wie beurteilen Sie die aktuelle Marktsituation im Bereich der

Spracherkenungssoftware?

KARBSTEIN: Der Retail- und Consumermarkt ist nach wie vor die tragende Säule des Geschäfts: Für die aktuelle Marktsituation ist eine verwirrende Produktvielfalt im Bereich der Diktiersysteme bezeichnend, da durch die Sublizenzierung dieser Software eine Vielzahl von Anbietern auf den Markt gekommen ist. Für den Anwender bleibt die Positionierung der verschiedenen Produkte dabei häufig unklar. Zukünftig werden weitere Märkte hinzukommen: die OEM-Integration in PC-Systeme und die Entwicklung von Anwendungssoftware, die sich auf Branchen spezialisiert. Der Kunde wird eine Anwendungssoftware kaufen, die voice-enabled ist und das spezifische Branchenvokabular mitbringt.

Welcher Trend zeichnet sich hinsichtlich der technologischen

Entwicklung ab?

KARBSTEIN: Der Trend geht eindeutig dahin, Anwendungsprogramme durch Spracherkennung anwenderfreundlicher zu gestalten. Beispielsweise durch die Einbindung von Dialogsystemen. Eine Anwendungssoftware wie Word könnte den Benutzer beim Anlegen von Tabellen per Sprache führen und auf Fragen reagieren.

In bezug auf Spracherkennungssoftware halten sich die deutschen Consumer bislang zurück. Wie wird sich der Markt ihrer Meinung nach in den kommenden Jahren entwickeln?

KARBSTEIN: Nach Einschätzung der Analysten wächst der Markt in den nächsten Jahren um 15 bis 20 Prozent. Die größten Wachstumsraten erwarte ich im Bereich Telefonie, das heißt, dem Einsatz intelligenter Dialogsysteme am Telefon und im Bereich Embedded Systems, also der Integration von Spracherkennungstechnologie in Geräte des täglichen Lebens. Solche Geräte, zum Beispiel Telefone, Video- und TV-Geräte, werden zukünftig auch per Sprache bedienbar sein.

Welche Ziele setzt man sich diesbezüglich bei IBM?

KARBSTEIN: Unser großes Ziel ist es, sprecherunabhängige Systeme zu entwickeln. Heute sind die Produkte sprecheradaptiv, der Anwender muß erstmal eine halbe Stunde Training hinlegen, dann rechnet das System eine dreiviertel Stunde an einem Sprachmodell, und erst dann kann die Arbeit beginnen. Davon wollen wir weg, zumal dies auch für die Telefonieanwendungen wichtig wird.

Außerdem arbeiten wir am Thema Sprachverständnis. Heute stehen hinter jedem Befehl 10 bis 15 Ausdrucksweisen, die die entsprechende Handlung auslösen. Wenn Sie aber keine dieser Vorgaben genau erwischen, erkennt das System den Befehl nicht. Wir arbeiten daran, noch mehr Flexibilität und interaktive Dialoge zu ermöglichen. Das wird uns sicher noch bis über das Jahr 2000 hinaus beschäftigen.

Wie würden Sie Ihre Zielgruppe definieren?

KARBSTEIN: Mit unseren Produkten möchten wir alle Anwender gleichermaßen ansprechen. Unsere bisherigen Erfahrungen zeigen, daß wir Anwender aus allen Bevölkerungsgruppen und Anwendungsbereichen haben, vom Rentner bis zum Studenten, vom Arzt bis zum Privatanwender. In der nächsten Zeit möchten wir besonders branchenspezifische Lösungen und firmenspezifische Lösungen für große Unternehmen fördern, indem spezielle Vokabulare, die sogenannten Topics, angeboten werden. Dies stützt auch den globalen Trend, der vom Retail- in den Business-Markt führt.

Wie ist denn die bisherige Akzeptanz der Produkte?

KARBSTEIN: Hoch. Sehen Sie sich allein die Chip-Leserwahl zum Produkt des Jahres 1998 an: Gleich nach den Office-Paketen Microsoft Office und Star Office wurde IBM Viavoice zur drittbesten Bürosoftware gewählt. Hier zeigt sich auch, welch hohen Nutzen der Anwender in der Alltagsarbeit aus Diktiersystemen zieht.

Können Sie diesbezüglich konkrete Marktzahlen vorweisen?

KARBSTEIN: Neben den im Fachhandel verkauften Lizenzen ist unsere Spacherkennung im Consumerbereich auf jedem Fujitsu-Rechner vorinstalliert, ebenso auf jedem Packard-Bell-Rechner und auf vielen Vobis-PCs. Wir erreichen damit hohe Zahlen im Retail-Bereich.

Wolfgang Karbstein, Leiter des IBM-Geschäftssegments Spracherkennung: "Unser großes Ziel ist es, sprecherunabhängige Systeme zu entwickeln."

Zur Startseite