Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

23.03.1984 - 

"Direkte" Datenerfassung an acht Arbeitsplätzen realisiert

Ford geht Lagerprobleme mit Spracheingabe an

KÖLN (pi) - Auf des Gebiet der Computer-Spracheingabe befinden sich die meisten Hersteller noch in den Kinderschuhen. Die derzeit angebotenen Systeme gelten zwar als sehr zukunftsträchtig, sind aber nach Ansicht von Experten heuer in der Regel noch unzureichend ausgereift. Nach mehreren kleineren Testinstallationen hat Die Computer Gesellschaft Konstanz mbH jetzt in einem ehrgeizigen Projekt mit den Kölner Ford-Werken ihre erste größere Installation im industriellen Bereich abgeschlossen. Seit Juli 1983 werden im Ersatzteillager des Automobilkonzerns die Versanddaten an nacht Arbeitsplätzen per Sprache erfaßt.

Im Kölner Lager werden die Ersatzteile für alle Wagentypen an die etwa 1200 inländischen Händler sowie an Händler in 15 europäischen Ländern versandt. Der Transport der Ersatzteile erfolgt überwiegend per Lkw. Im Lager werden Versandeinheiten in Form von sogenannten Packstücken gebildet, die zunächst an Verteilzentren und von dort an die einzelnen Händler gehen. Diese Packstücke werden vor dem Verlassen des Lagers und vor dem Verladen auf die Lkw's erfaßt. Die Lagermitarbeiter nehmen die Versanddaten per Sprache auf und erstellen sogenannte Ladelisten als Transportbegleitpapiere. Die erfaßten Daten (Verpackungsart, Packstück-Nummer, Gewicht, Kenndaten von Verteilzentrum, Spedition und Lkw) erscheinen zum einen auf den Ladelisten und werden zum anderen in der zentralen DV benötigt, von der aus die Rechnungsschreibung an die Händler erfolgt.

Bisher wurden die Ladelisten von Hand geschrieben und die für die Zentrale notwendigen Daten in Erfassungsbelege eingetragen. Das computergesteuerte Ladelistensystem mit Spracheingabe für die direkte Datenerfassung vor Ort, vereinfachte und beschleunigte den Arbeitsablauf und machte ihn zudem sicherer. Die Spracheingabe ermöglicht es, die Daten zum Zeitpunkt des Entstehens zu erfassen. Sie können damit unmittelbar vom Rechner geprüft und nach Bedarf jederzeit an die zentrale DV weitergeleitet werden.

Um die Mobilität des Benutzers sicherzustellen, erfolgt die Datenübertragung zum Spracheingabegerät und damit zum Computer drahtlos. Die Sprachsignale werden dabei mit -Hilfe eines hochwertigen Sprechfunks, wie er beispielsweise in Fernsehstudios zum Einsatz kommt, übertragen.

Da der Benutzer durch seine Mobilität bei der Erfassung zwangsläufig keine visuelle Kontrolle (zum Beispiel über Bildschirm) über die von ihm per Sprache erfaßten Daten haben kann, mußte eine spezielle Form des Computer-Feedbacks gefunden werden. Der Benutzer erfährt dabei durch ein akustisches Signal über sein "Headset", wenn eine Eingabe falsch war oder nicht korrekt eingesprochen wurde. Näheres kann er auf Monitoren ablesen, auf denen in Großschrift die erfaßten Daten mitprotokolliert werden.

Die tagsüber laufende Online-Verarbeitung wird mit einem Siemens-Prozeßrechner System 300 abgewickelt, der auch für die Steuerung der Spracheingabegeräte (Verwaltung der Wortschätze für die einzelnen Benutzer) verantwortlich ist. Morgens und abends wird eine Datenfernübertragung zur zentralen Ford-DV geschaltet. Diese Rechnerkopplung dient dazu, einmal die zentral disponierten Händlerbestellungen an das dezentrale Ladelistensystem mitzuteilen und zum anderen in umgekehrter Richtung der Zentrale den Vollzug des Versands zurückzumelden.

An acht Arbeitsplätzen werden täglich etwa 80 Ladelisten produziert. Sie enthalten die zum Versand anstehenden täglich durchschnittlich 1200 Packstücke und beziehen sich auf etwa 250 Rechnungen, die an die Händler gehen. Bei diesen Datenmengen ist es notwendig, daß sich der Benutzer jederzeit informieren kann, welche Daten bereits im System bearbeitet wurden. Hierzu stehen eine Reihe von Informationsdiensten zur Verfügung, die sich der Benutzer vor Ort auf den Monitoren anzeigen lassen kann. Bestimmte Dienste werden zentral beim Rechner abgerufen. Das gilt auch für diverse Statistiken.

Von der Funktion her ist die Hardware zu trennen in

- Geräte, die für den Benutzerdialog dienen und

- in die zentrale Rechnerhardware.

Die Hardware für den User-Dialog (siehe Bild 1) dient der Kommunikation des Anwenders mit dem System. Diese Kommunikation erfolgt auf verschiedenen Ebenen:

- Der Benutzer erfaßt Daten per Sprache

- Das Gewicht der Packstücke wird von Bodenwaagen, welche direkt an den Rechner angeschlossen sind, an das System gegeben

- Die Mitteilungen des Systems an den Benutzer erfolgen akustisch (Piepston) und visuell (Monitor).

Während Bodenwaage und Monitor ortsfest sind, also per Kabel mit dem Rechner verbunden sind, geschieht die weitere Kommunikation mit dem Benutzer drahtlos. Jeder Lagermitarbeiter, der mit dem System arbeitet, trägt als Head-Set eine Hörsprechgarnitur, die mit einem mobilen, sehr leichten Funksender verbunden ist. Die Hörsprechgarnitur die aus Mikrofon und Kopfhörer besteht, ist trageleicht und garantiert zusammen mit der Funkstrecke eine verlustfreie Übertragung der Sprachsignale. Den Piepston überträgt eine Ultraschallanlage. Zu diesem Zweck ist auf dem Funksender ein kleiner Ultraschallempfänger aufmontiert, der die empfangenen Signale an den Kopfhörer der Hörsprechgarnitur weitergibt.

Neben dem Ultraschallsender stehen in der Zentrale für die einzelnen Arbeitsplätze Funkempfänger und Spracheingabegeräte. In letzteren werden die Sprachsignale in DV-verarbeitbare Daten umgesetzt. Bei den Computer-Spracheingabegeräten, CSE 1050, handelt es sich um Einzelworterkennungsgeräte mit einem Wortschatz von 60 Wörtern. Diese Hochleistungsgeräte erlauben auch noch bei starken Umfeldgeräuschen eine sichere Spracherkennung.

Forderung nach Praxisnähe

Die zentrale Hardware des Ladelistensystems (Bild 2) dient der Steuerung. des Benutzerdialogs sowie des Dialogs mit dem Operator. Das Rechnersystem besteht aus einem Siemens R30 Minicomputer mit Wechsel- und Festplatten sowie mehreren Druckern- und Bildschirmterminals.

Bei der Realisierung des Projektes mußte mehrfach Neuland betreten werden. Die Aufgaben lagen einmal im Bereich des Engineerings, wo es galt, unterschiedlichste Hardwarekomponenten zu integrieren und zum anderen insbesondere die Technik der Spracherkennung im Zusammenwirken mit drahtloser Übertragung praxisgerecht einzuführen. In der R30 mußten spezielle Anschaltungen und Softwareanschlüsse für Spracheingabe, Monitore, Ultraschallanlage und Bodenwaagen entwickelt werden.

Die Forderungen von Ford nach einem praxisgerechten System zog sich wie ein roter Faden durch die Konzeptions- und Realisierungsphase des Projektes. Sie fand ihren Niederschlag in drei Zeilen:

- Benutzergerechte Bedienoberfläche

- Schnelle Reaktionszeiten und hohe Verfügbarkeit des Systems

- Ergonomische Arbeitsmöglichkeit mit der Spracheingabe.

Besonderes Augenmerk wurde bei der Benutzeroberfläche auf die Gestaltung des sprachgesteuerten Dialogs gelegt, die einige gravierende Unterschiede zur üblichen Tastatureingabe zeigte. Die Eingabe per Sprache und das Fehlen der sofortigen visuellen Kontrolle dieser Eingabe machten sprachspezifische Dialogmaßnahmen notwendig:

- Sprecheridentifikation

Zu Beginn der Arbeit hat sich der jeweilige Benutzer mit seinem Namen zu identifizieren. Nach richtiger Erkennung des sich identifizierenden Benutzers wird dessen Wortschatz geladen. Nun kann der Benutzer mit seinem Dialog beginnen. Da es sich um sprecheradaptive Spracheingabegeräte handelt, sind Fremdsprachen und Dialekte der Benutzer kein Problem für das System.

- Korrekturmodus

Hat der Benutzer falsch eingegeben oder hat das System eine Eingabe falsch interpretiert, so wird dies dem Benutzer zurückgemeldet. Er hat dann die Möglichkeit über spezielle Kommandos die letzte Eingabe oder eine ganze Transaktion zu löschen.

- Dynamisches Nachtraining

Bei Verschlechterung der Erkennungssicherheit besteht die Möglichkeit, wahrend des Betriebes ein Nachtraining durchzuführen. Der Benutzer wählt dabei das oder die kritischen Worte aus und trainiert sie neu. Das System übernimmt die neugebildeten Referenzmuster in den Wortschatz.

- Unterbrechung der Spracheingabe

Will der Benutzer den Dialog unterbrechen, da er beispielsweise mit seinem Kollegen sprechen will, kann er die Spracheingabe "taub" schalten.

Kurze Reaktionszeiten während des Dialogs und eine hohe Systemverfügbarkeit als Anforderungen an die Performance des Gesamtsystems sind typische Merkmale für DV-Systeme in der Produktion. Dazu kam die Forderung nach erkennungssicheren Spracheingabegeräten. Auf der Grundlage der Prozeßrechnerhard- und Grundsoftware wurde ein Multi-User-System entwickelt, welches alle acht Benutzer simultan bedient. Trotz umfangreicher Datenbewegungen sind die Reaktionszeiten des Systems so gut, daß die natürliche Eingabegeschwindigkeit des Benutzers nicht beeinträchtigt wird. Die geforderte Erkennungssicherheit von 98 Prozent wurde bei allen acht Arbeitsplätzen erreicht. Es zeigte sich, daß die Spracheingabegeräte selbst auch in geräuschvoller Umgebung erstaunlich hohe Erkennungssicherheit brachten. Während ein permanenter Geräuschpegel nicht sehr kritisch ist, da er dem System vom Training her bekannt ist, stellt das Auftreten lauter, sporadischer Geräusche, wie Lautsprecheransagen, Lkw-Motorengeräusche sowie Klirr- und Stoßgeräusche der Transportgeräte größere Anforderungen an die Spracheingabe. Durch Spezialmikrofone mit zwei Eingängen, die eine Kompensierung von Nebengeräuschen durchfuhren, wurde dies gelöst.

Trotz aller technischen Maßnahmen erforderte die Einführung der Sprache bei den Benutzern eine intensive Vorbereitung und sorgfältige Betreuung. So kann heute gesagt werden, daß nach einer relativ kurzen Einführungsphase doch eine Zeit von zwei bis drei Wochen notwendig war, bis der Benutzer den richtigen Umgang mit der Spracheingabe gelernt hat. In diesem Zeitraum ist eine fachmännische Betreuung unbedingt notwendig.

Die Schaffung maßgeschneiderter Problemlosungen, wie sie von Anwendern gefordert werden, setzt zu dem eine enge Kooperation zwischen Anwender und Hersteller während aller Projektphasen voraus