Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

18.11.2005

Dokumente im Erkennungsdienst

Ralf Jürgensen 
Mit der Qualität des Scanvorgangs, der Identifizierung des Dokumententyps und der technischen Finesse bei der Zeichenerkennung steht und fällt die automatisierte Dokumentenverarbeitung.

Die Herausforderung bei der automatischen Dokumentenverarbeitung liegt im elektronischen Erfassen der in Papierform eingehenden Dokumente, deren Klassifizierung sowie im Auslesen der relevanten Daten. Hochleistungsscanner mit automatischem Papiereinzug digitalisieren die Dokumente Seite für Seite ohne Vorsortierung und speichern sie auf einem Rechner in einer Datei mit gängigem Grafikformat.

Wann lohnen sich Erkennungssysteme?

Spezialsoftware bereitet die gescannten Daten mit einer Kombination aus ICR- und OCR-Engines zur Weiterverarbeitung auf. Eine bessere Auslesung mit sehr geringer Fehlerquote entsteht durch die Aufbereitung der im Grafikformat erfassten Daten vor dem Auslesen. Wenn nötig, wird das gescannte Image bereinigt und vertikal ausgerichtet.

Die Einführung dieser Lösung amortisiert sich aufgrund des hohen Automatisierungsgrads in der Regel bereits nach acht bis zwölf Monaten. Der Return on Investment hängt unter anderem von der Anzahl der zu verarbeitenden Dokumente und der Menge der pro Dokument zu erfassenden Daten ab. Interessant wird ein System bereits bei 100 bis 200 Dokumenten pro Tag. Hauptvorteile sind der Automatisierungseffekt, die transparentere Verarbeitung, Zeit- und Kostenvorteile und die fließende Übergabe der Daten an nachgeschaltete Systeme wie DMS, ERP, Archiv oder CRM.

Hier lesen Sie …

• was ein Erkennungssystem leistet;

• welche Erkennungsmethoden existieren;

• welche Faktoren die erfolgreiche Dokumentenerkennung bestimmen.

Erkennungsraten Angaben in Prozent

Zeichenart Maximale Erkennungsrate

Handgeschriebene Schreibschrift 92 bis 95

Handgeschriebene Blockbuchstaben 97

Handgeschriebene Ziffern 99

Druck- und Maschinenschriften 99

Barcodes 100

Ankreuzfelder 100

Handelsübliche Scanner erzielen in der Regel sehr gute Ergebnisse. Ihre Grenzen sind jedoch erreicht, wenn Dokumente eingehen, die schon mit bloßem Auge kaum lesbar sind. Selbst die besten Scanner können keine besseren Ergebnisse erzeugen, als die Papiervorlage aufgrund ihrer Qualität liefert. Hier spielen mehrere Faktoren eine Rolle. Die verwendeten Fonts wirken sich ebenso positiv oder negativ aus wie die Druckqualität: Laserdruck oder Matrixdruck macht ebenso einen Unterschied wie sehr schwacher, unregelmäßiger oder leicht verschwommen erscheinender Druck. Hinzu kommen die Verwendung von Kursivschriften oder handschriftliche Eintragungen. Die Erkennung maschinell gedruckter Zeichen in Standardschriftarten - neben lateinischen auch griechische und kyrillische Schriften - erreicht sehr gute Trefferquoten von nahezu 100 Prozent.

Weitere Störeinflüsse auf den Dokumenten sind Verunreinigungen, Hintergrundmuster sowie Raster und Linien, aber auch handschriftliche Vermerke. Diffizil wird es, wenn relevante Daten auf Raster oder Linien gedruckt sind. Die richtige Interpretation der Zeichen ist dann erheblich erschwert oder ganz unmöglich. Ein weiteres Problem tritt auf, wenn der Scanner die Papiere nicht sauber einzieht und die Seite schief über den Belichter läuft. Dies führt zu Verzerrungen und erschwert die Zeichenerkennung. Auch die Papierqualität beeinflusst die Erkennungsquote. So können bei sehr dünnem Papier Störeffekte auftreten, wenn ein Rückseitenaufdruck durchscheint.

Damit eine saubere Zeichenerkennung möglich wird, müssen die eingescannten Images von Störeffekten so gut wie möglich bereinigt werden. Schräg eingezogene und um 90 oder 180 Grad gedrehte Seiten werden in die richtige Ausrichtung gebracht. Durch das Scannen entstandene Verzerrungen werden dann ebenfalls behoben. Anschließend erfolgt aufwändig die Bildbereinigung: Schmutzeffekte, Linien und Raster werden aus dem Image herausgefiltert. Jedoch sollte nicht zu viel bereinigt werden, um eine Fehlinterpretation der Zeichen auszuschließen. Durch intelligente Zusatzmodule zur Scan-Software können Bilder, die einen vorgegebenen Kontrastumfang überschreiten, manuell angepasst werden. Ebenso lassen sich dokumentenspezifische Korrekturprofile automatisch anwenden.

Aus Grafik wird Ascii

Mit Scannen, Speichern und Bereinigen ist die Vorarbeit getan: Die Daten liegen elektronisch vor. Jetzt kann die Erkennung beginnen. Sie sorgt dafür, dass aus Zeichen im Grafikformat (NCI = Non Coded Information) ein maschinenlesbarer Ascii-Code (CI = Coded Information) wird.

Grundsätzlich werden die Techniken zur Erkennung von Maschinen- und Druckschriften (OCR = Optical Character Recognition) und Blockhandschrift (ICR = Intelligent Character Recognition) unterschieden. Optical Mark Recognition (OMR) ist speziell für das Erkennen von Ankreuzfeldern und alle Arten von Barcodes geeignet. Stand der Kunst bei der automatischen Zeichenerkennung ist heute der Einsatz unterschiedlicher OCR- und ICR-Techniken mit Hilfe eines Abstimmungsmechanismus. Da jede Technik mit anderen Methoden und Algorithmen arbeitet, werden diese je nach Bereich einzeln oder gemeinsam eingesetzt. Im letzteren Fall werden die Ergebnisse entsprechend gewichtet - dieser Vorgang nennt sich auch "Voting".

Mit der reinen Zeichenanalyse lassen sich allerdings keine hundertprozentigen Ergebnisse erzielen. So kann es vorkommen, dass in einer Schriftart eine 0 (Null) wie ein O (Buchstabe O) aussieht oder auf einem gering aufgelösten Faxbild eine 8 in einer kleinen Schriftgröße nicht von einem B zu unterscheiden ist. Solche objektiven Probleme sind nur durch zusätzliche Informationen zu klären. Dies können hinterlegte Stammdaten sein wie etwa eine Kundennummer oder auch formale Regeln wie das Datumsformat. Ein Betrag kann auch durch Summenbildungen, wie beispielsweise Menge mal Einzelpreis gleich Einzelsumme, Summe aller Einzelsummen gleich Nettosumme oder Nettosumme plus Mehrwertsteuer gleich Bruttosumme, verifiziert oder automatisch korrigiert werden.

Bei diesem Vorgang wird OCR, das heißt die Umwandlung einer Pixelansammlung in ein Zeichen, das der Computer verarbeiten kann, bereits überschritten. Die Zeichenerkennung ist nur Hilfsmittel für die eigentliche Aufgabe. Ziel moderner Dokumentenerkennung ist die Klassifizierung der Schriftstücke, deren richtige Erkennung und zusätzlich die Extraktion relevanter Daten. Handelt es sich bei dem Schreiben um eine Adressänderung, eine Kündigung, eine Rechnung oder einen Antrag? Mit dieser Information lässt sich der entsprechende Business-Workflow anstoßen. Dafür ist es notwendig, dass ein System erkennt, ob es sich bei einer Ziffer um eine Kundennummer handelt, die wertvolle Leitinformationen liefert. Dafür werden unterschiedliche Techniken, statistische Verfahren, neuronale Netze sowie intelligente Stichwortsuchen angewendet. Sogar handschriftliche Briefe, wie sie gerade im Kontakt mit Endkunden noch häufig vorkommen, sind mittlerweile klassifizierbar.

Neben dem reinen Erkennen der Zeichen sind auch Art und Struktur der Dokumente zu berücksichtigen. Hier sind zwei grundlegende Ansätze zu unterscheiden. Bei dem ersten Ansatz wird für die eingehenden Dokumente eine Schablone, ein so genanntes Template, hinterlegt, mit dem man die Vorlage ausliest. Der Aufwand der Schablonenerstellung wird mit großer Lesegenauigkeit bei hoher Lesegeschwindigkeit belohnt. Im Gegensatz dazu extrahiert der adaptive Erkennungsansatz aus dem Volltext einer beliebigen Vorlagenseite die relevanten Daten über Stichwörter oder Strukturen.

Fazit: Mit dem heutigen Stand der Technik ist ein sehr hoher Automatisierungsgrad in der Dokumentenverarbeitung erzielbar. Sinnvoll eingesetzt reicht das Potenzial bis zum Aufbau einer digitalen Poststelle. (ue)