Scharfes Auge in Sachen OCR

28.01.1999

MÜNCHEN: Stupides Eintippen von Textvorlagen, die in Papierform vorliegen - ein Spaß, auf den nicht nur Schreibkräfte verzichten können. OCR (Optical Character Recognition) bezeichnet ein Verfahren zur Erkennung von alphanumerischen Zeichen einer Vorlage. Die jüngste Version der Software "Finereader 4.0 Professional" des russischen Entwicklers Bit Software will OCR perfektionieren. ComputerPartner war neugierig und hat das Programm genauer unter die Lupe genommen.Kein Schnickschnack verunstaltet die Box aus stabilem Karton. Der Hinweis "OCR-Technologie", der Name der Software und eine aussagekräftige Grafik ergänzen sich harmonisch. Das Produkt fällt durch sein Layout angenehm auf, und jeder weiß sofort, was drin ist. Dem steht die Rückseite des Kartons in nichts nach. Auf Anhieb wird klar, daß es eine "Standard"- , eine "Professional"- und eine "Enterprise"-Version gibt. Eine Tabelle zeigt, welche Version für wen geeignet ist und was die jeweilige Ausgabe alles kann. Es bleibt keine Frage offen - auch für den Endkunden nicht. Der Händler kann sich entspannt zurücklehnen.

Das Paket fördert zwei Werbebroschüren, das einfache, aber um so aussagekräftigere Merkblatt "Wichtige Installationshinweise", ein siebenseitiges Heftchen für den "Quickstart", ein gut strukturiertes Handbuch mit 68 Seiten, die CD-Rom und eine eidottergelbe "Start-Up-Diskette" zutage. Kleiner Wermutstropfen: Trotz des durchdachten Inhaltsverzeichnisses würde sich ein Stichwortverzeichnis am Ende des Handbuches gut machen. Dennoch bestätigt sich der erste, positive Eindruck: Alles ist klar und eindeutig. Selbst Käufer, die noch nie eine Software installiert haben, dürften mit diesen Informationen ohne Schwierigkeiten zu Rande kommen.

Apropos Installation: Die Systemvoraussetzungen für die Professional-Version sind ein 486er-Prozessor von Intel oder besser ein Pentium 133, 16 Megabyte Arbeitsspeicher für Windows 95, 32 MB für NT 4.0 sowie mindestens 30 MB freier Festplattenspeicher für die minimale Installation oder rund 60 MB für die vollständige. Ein Twain-kompatibler Scanner oder ein gleichwertiges Gerät darf natürlich nicht fehlen.

Die Installation selbst verlief in unserem Test ohne Probleme.

Scaan AS Finereader CAN

Im Gegensatz zur Version 3.0 präsentiert sich die aktuelle Ausgabe mit einer überarbeiteten Benutzeroberfläche, die wesentlich intuitiver gestaltet ist. Für User, die mit ihren Bewegungen geizen, gibt es neuerdings die Option "Scan & Read". Diese Funktion automatisiert auf Wunsch die ersten vier Schritte beim Scanvorgang. Eine Vielzahl individuell konfigurierbarer Optionen lassen keine Wünsche offen. So kann beispielsweise die Software mehrere Seiten hintereinander einscannen, ohne daß jedesmal die Prozedur von Anfang an begonnen werden muß. Die bereits eingelesenen Vorlagen verarbeitet das Programm im Hintergrund. Glücklich, wer einen Scanner mit automatischem Blatteinzug hat. Ansonsten gilt: Deckel auf, Deckel zu, Deckel auf... Zudem sollten sich diejenigen Anwender ein wenig in Geduld üben, die gerade mal so die Hardware-Mindestvoraussetzungen des Systems erfüllen.

Je nach Lust und Laune des Anwenders lassen sich verschiedene Modi für die Seitenanalyse, Formatierung, Erkennung und Rechtschreibprüfung individuell einstellen. So stellt die Software beispielsweise den erkannten Text mit oder ohne Originallayout dar oder übernimmt auf Wunsch lediglich markierte Passagen.

Ein herausragendes Charakteristikum der Software ist die Spracherkennung. Das Programm kann Fremdsprachentexte von A wie Afrikaans bis U wie Ukrainisch erkennen. Da ComputerPartner kein Text in Suaheli vorlag, mußte eine Originalpassage aus einem Roman des diesjährigen portugiesischen Literatur-Nobelpreisträgers José Saramago herhalten.

Während sich bei einer Auflösung von 150 ppi noch relativ viele Fehler eingeschlichen hatten, war das Ergebnis trotz der schlechten Papierqualität bei 300 ppi tadellos. Kein einziger Fehler unterlief der Software. Selbst die portugiesischen Sonderzeichen wie beispielsweise Tilden und Akzente waren am richtigen Platz. Angesichts der maximalen Auflösung von 1.200 ppi wäre aber noch genügend Luft gewesen. Ein schneller Prozessor und viel Arbeitsspeicher sind bei hohen Auflösungen ein Muß, denn sonst werden das Einscannen und die Texterkennung zur Geduldsprobe.

Eine Reihe von weiteren Features ergänzen die Software sinnvoll. So erkennt das Programm zum Beispiel Barcodes, Textspalten oder Grafiken und Tabellen, die im RTF-, TXT-, CSV-, XLS- oder DBF-Format abgespeichert werden können. Der Export der Texte zu Word, Excel, Word Pro, Word Perfekt oder ODMA ist ebenso möglich, wie das Abspeichern der Dokumente im HTML-Format. Zudem können mit Hilfe der Software neue Symbole trainiert werden. Highlight der Enterprise-Version: die Handschriftenerkennung.

Die Pluspunkte der Software werden bei der Händlerunterstützung des Generalimporteurs Mitcom leider wieder verspielt.. Insbesondere an der gebührenhungrigen 0180-Telefonnummer dürften sich Wiederverkäufer und Endkunden stören. Ansonsten ist neben dem klassischen Standardmaterial lediglich eine kostenlose Try-and-buy-Version für 30 Tage und 50 Scans erwähnenswert. Das Motto "Je größer die Order, desto höher die Marge" versteht sich schon fast von selbst. (mm)

Fremdsprachen nicht ausgeschlossen: Die Finereader-Software erkennt ausländische Texte ohne Murren. Auch Grafiken und Tabellen werden problemlos übernommen.

Zur Startseite