Serverbasierte Texterfassung

Spracherkennung im Home Office

Armin Weiler kümmert sich um die rechercheintensiven Geschichten rund um den ITK-Channel und um die Themen der Distribution. Zudem ist er für den Bereich PCs und Peripherie zuständig. Zu seinen Spezialgebieten zählen daher Notebooks, PCs, Smartphones, Drucker, Displays und Eingabegeräte. Bei der inoffiziellen deutschen IT-Skimeisterschaft "CP Race" ist er für die Rennleitung verantwortlich.
Die sprachbasierte Eingabe von Texten erleichtert vielen Menschen die Arbeit, wenn sie größere Diktate verschriftlichen wollen. Dies geht auch am heimischen Schreitbisch, doch es gibt einige Punkte zu beachten.
Wer es gewohnt ist, Texte per Spracherkennung zu erfassen, will darauf auch im Home Office nicht verzichten.
Wer es gewohnt ist, Texte per Spracherkennung zu erfassen, will darauf auch im Home Office nicht verzichten.
Foto: Nuance

Die Spracherkennung hat in den letzten Jahren immense Fortschritte gemacht. In vielen Branchen wie dem Rechtswesen, Finanzen, Versicherungen, im Gesundheitswesen aber auch in Behörden gehört die sprachbasierte Erfassung von Texten zum Arbeitsalltag. "Das Diktieren von Texten und die sprachbasierte Steuerung von Anwendungen ist mindestens dreimal schneller als das Tippen beziehungsweise die Bedienung mit der Maus", erläutert Bernd Stünkel, Head of Sales beim Spracherkennungsspezialisten Nuance, die Vorteile.

Da jetzt viele Mitarbeiter durch die Corona-Pandemie im Home Office arbeiten, wollen sie auch dort auf die Spracheingabe nicht verzichten. Dabei gibt es aber einige Hindernisse. Nicht immer ist die passende Software oder eine gültige Lizenz auch Zuhause verfügbar.

Davor Kantuser (Nuance) und Andreas Platt vom Partnerunternehmen egs eklärten auf dem 13. c.m.c.-Kongress den Interessenten die Spracherkennungs-Cloud.
Davor Kantuser (Nuance) und Andreas Platt vom Partnerunternehmen egs eklärten auf dem 13. c.m.c.-Kongress den Interessenten die Spracherkennungs-Cloud.
Foto: Tschepe/IDG

Es fehlt auch an der notwendigen Hardware, vom Diktiergerät über einen leistungsstraken Rechner bis zu den sicheren und datenschutzkonformen Speichermöglichkeiten. "Mitarbeiter greifen im Home Office auch gerne auf Software und Apps zurück, die sie aus dem privaten Umfeld kennen. Dies ist vor allem aus Sicht des Datenschutzes bedenklich", warnt Nuance-Marketing-Spezialistin Sandra Nötzel. Wenn Adressbücher mit Kunden- und Partnerkontakten auf die Server von Chat-Applikationen wie WhatsApp hochgeladen werden oder Mitarbeiter Sprachassistenten wie Siri und Alexa einsetzen, um Geschäftsbriefe und Berichte zu verfassen, kann es beispielsweise schnell zu Verstößen gegen die Datenschutzgrundverordnung (DSGVO) kommen.

Spracheingabe mit Standardgeräten

Mit einer serverbasierte Spracherkennung lassen sich viele der geschilderten Probleme lösen. Allerdings muss dabei auch der verwendete PC und die Verbindung zum Firmennetzwerk sicher sein. Deswegen sollte immer eine VPN-Verbindung eingerichtet sein. Besonders wichtig ist dies, wenn die Anwender im Home Office nicht vom Arbeitgeber administrierte, sondern private Geräte nutzen.

Lesen Sie auch: Datenschutz im Gesundheitswesen

Da die intelligente Sprachverarbeitung auf dem Server geschieht, sind die Anforderungen an die Rechenleistung der verwendeten Hardware und an die Bandbreite der Datenverbindung überschaubar. Oft können Standardgeräte wie Smartphones, Tablets oder Notebooks zur Spracherfassung verwendet werden.

Bei der serverbasierten Spracherkennungslösungen können häufig handelsübliche Standardgeräte wie Smartphones zur Spracheingabe genutzt werden.
Bei der serverbasierten Spracherkennungslösungen können häufig handelsübliche Standardgeräte wie Smartphones zur Spracheingabe genutzt werden.
Foto: Nuance

Bei bei der Auswahl der passenden Lösung sollte auch darauf geachtet werden, dass sie einfach zu implementieren ist und dass der Trainingsaufwand der Software gering ist. Damit alle wesentlichen Anforderungen erfüllt werden, hat Nuance eine Checkliste erstellt. Reseller können so mit ihren Kunden Punkt für Punkt durcharbeiten, ob die gewählte Spracherkennungslösung den Ansprüchen genügt. Folgende Fragen sollten dem Anbieter gestellt werden:

  • Welche Bereitstellungsmodelle bieten Sie?

  • Muss ich die Software selbst installieren und managen oder kann ich sie auch als Service beziehen?

  • Wie viele Nutzer können parallel mit der Software arbeiten? Welche Skalierungsoptionen gibt es?

  • Wie ist die Software aufgebaut? Muss sie auf jedem Client installiert werden oder gibt es eine zentrale Serverkomponente?

  • Wie lange dauert die Installation? Wie aufwendig ist die Wartung?

  • Wie genau ist die Spracherkennung? Kann sich die Software an einzelne Sprecher anpassen?

  • Wie schnell kann die Software ein branchenspezifisches Vokabular lernen?

  • Muss die Software trainiert werden? Falls ja, wie hoch ist der Aufwand?

  • Lässt sich die Software in Office-Umgebungen und Collaboration-Plattformen integrieren? Wie aufwendig ist die Integration?

  • Wie sicher ist die Software? Sind Übertragung und Speicherung verschlüsselt? Entspricht das Sicherheitsniveau den gesetzlichen Vorgaben?

  • Werden alle Belange des Datenschutzes eingehalten? Welche Zertifizierungen und Belege gibt es dafür?

  • Falls die Software als Service aus einer Cloud bereitgestellt wird: Ist die Cloud zertifiziert? Werden die Daten beim Transport und bei der Speicherung verschlüsselt? Befinden sich die Rechenzentren im europäischen Rechtsraum?

Zur Startseite