Omnipage Pro 11: fast fehlerfrei vom Papier auf den Bildschirm

11.10.2001
Die Firma Scansoft liefert den Programmklassiker Omnipage zur Erfassung von Dokumenten über den Scanner in der elften Version aus. Ob die neuen beziehungsweise verbesserten Funktionen einen Kauf des Programms rechtfertigen, hat ComputerPartner untersucht.

Die OCR-Software (Optical Character Recognition) "Omnipage Pro 11" soll die Erkennungsgenauigkeit eingelesener Dokumente - verglichen mit der Vorgängerversion - um 40 Prozent erhöhen. Eingescannte Vorlagen können direkt als PDF-Dateien gespeichert werden. Aus selbst angefertigten PDF-Dokumenten mit Grafiken, Tabellen und Text lassen sich vollständig formatierte Word-, Excel- oder HTML-Dokumente erstellen, die man weiterbearbeiten kann.

Auf der Produktbox findet sich eine kurze, bebilderte Leistungsbeschreibung des Programms.

Eine Übersicht der Neuerungen im Vergleich zu den Anwendungen "Ominipage Pro 10" und "Lite OCR" von Scansoft ist ebenfalls auf der Verpackung aufgedruckt. Die Systemanforderungen und eine Liste der unterstützten Scanner runden die Informationen für den potenziellen Käufer ab. Die Verpackung enthält neben der Programm-CD ein Benutzerhandbuch mit 100 Seiten.

Die Software ließ sich problemlos installieren. Nach der Übertragung der Programmdateien auf die Festplatte wurde automatisch der so genannte "Scanner-Assistent" gestartet. Omnipage prüft zunächst die Scanner-Verbindung und die Treiber. Der Benutzer wird dann gebeten, diverse Dokumente, zum Beispiel ein Bild oder ein reines Textdokument, in den Scanner einzulegen, worauf das Programm den Scanner einrichtet.

Erste Eindrücke

Der Lernanleitung im Benutzerhandbuch folgend, verarbeiteten wir zunächst die auf der Programm-CD im TIF-Format vorliegenden Beispieldokumente. Mit den Standardeinstellungen erfolgt die OCR-Verarbeitung automatisch. Das gescannte oder bereits als Bild vorliegende Dokument wird analysiert. Werden Buchstaben oder Worte nicht eindeutig erkannt, meldet sich der "OCR-Proofreader" und zeigt diese in einem Fenster an. Der Nutzer erhält aus einem Lexikon Angebote, wie das Wort oder das Zeichen heißen könnte. Die vorgenommen Änderungen werden von Omnipage Pro 11 genutzt, um später die Erkennungsgenauigkeit zu erhöhen.

Der OCR-Assistent ist ein ausgezeichnetes Hilfsmittel für Anfänger, den Umgang mit dem Programm zu erlernen. Die für jeden Bildschirm angebotene kontextbezogene Hilfe ist dabei eine wertvolle Einrichtung. Der Assistent führt Schritt für Schritt durch die Einstellungen des Programms, zum Beispiel die Auswahl der Sprachen, die bei der OCR-Erkennung berücksichtigt werden. Als Abschluss der OCR-Verarbeitung kann das Dokument entweder gespeichert oder direkt in einem Textprogramm angezeigt werden.

Bei der Installation untersucht Omnipage Pro 11, welche Anwendungen auf dem PC-System installiert sind, um gegebenenfalls die OCR-Verarbeitung zu integrieren. Ist auf dem System zum Beispiel Microsoft Office vorhanden, so enthalten Word, Excel und Powerpoint nach der Installation von Omnipage spezielle Einträge im Dateimenü. Mit ihnen lassen sich Einstellungen für die Texterkennung vornehmen beziehungsweise die Erkennung starten. Wir scannten eine mit Word erstellte Seite, die nur Text der Schriftart Times New Roman enthielt. Zu unserem Erstaunen wurde aber das verarbeitete Dokument mit der Schriftart Garamond erstellt.

PDF-Konvertierung

Besonders interessant ist die Möglichkeit der Verarbeitung von PDF-Dokumenten. Unsere mit Adobe Acrobat 5.0 erstellten Dokumente mit Text und Grafik konnten wir mit Omnipage öffnen. Text, Bilder und die komplette Formatierung wurden beim Erkennungsprozess übernommen. Die Fähigkeiten des Acrobat Readers, Textteile über die Zwischenablage auszugeben, die dann in eine Textverarbeitung übernommen werden können, werden durch die PDF-Funktionen von Omnipage bei weitem übertroffen. Die schon in der Version 10 von Omnipage Pro vorhandene Option, PDF-Dokumente zu erstellen, ist natürlich auch in der aktuellen Version gegeben.

Das Speichern der Dokumente kann in diversen Formaten für Programme wie Word, Excel, Wordperfekt oder als ASCII-Text erfolgen. Hervorzuheben ist dabei die Fähigkeit von Omnipage Pro 11, HTML-Dokumente in unterschiedlicher Formatierung auszugeben. Wir wählten ein mehrseitiges PDF-Dokument und spezifizierten, dass für jede Seite eine separate HTML-Datei erstellt werden sollte. Dabei wurden nach dem Erkennungsprozess die HTML-Seiten und ein Index mit Miniaturen der Seiten (als Hyperlinks selektierbar) auf die Festplatte abgelegt. Sogar die Erstellung eines separaten Ordners für die Bilder des Dokuments und die Nutzung von CSS (Cascading Style Sheets) für die Formatierung wurde von Omnipage realisiert.

Verbesserungen

Scansoft behauptet, dass sich die Erkennungsgenauigkeit gegenüber früheren Versionen um 40 Prozent verbessert habe. Dies sei durch den Einsatz von drei verschiedenen OCR-Engines erreicht worden. Im Test konnten wir keine Verbesserung dieses Ausmaßes feststellen. Ein wesentlich besseres Erkennungsergebnis soll auch bei der Verarbeitung von Dokumenten minderer Qualität, wie Faxe oder Kopien, erzielt werden. Auch hier bekamen wir unseren Testvorlagen keine besseren Resultate.

Gute bis sehr gute Ergebnisse erhielten wir bei der Verarbeitung guter Vorlagen. In fast allen Fällen wurden die Dokumente korrekt und komplett erkannt. Die neu in Omnipage Pro 11 eingebaute Intelli-Train-Funktion, mit deren Hilfe sich das Programm die durch den Nutzer bei der Erkennung vorgenommenen Korrekturen merkt, verbessert merklich die Verarbeitungsqualität.

Die Leistung des Programms bei der Erkennung von Tabellen ist ebenfalls offensichtlich. Die von uns erzielten Erfolge beim Scannen und Verarbeiten von Tabellen mit und ohne Rasterlinien sind beeindruckend. Positiv ist auch die Behandlung von Farbbildern, Hintergrundfarben und farbiger Schrift in Dokumenten zu beurteilen.

Die bei der OCR-Erkennung verwendeten "Anwender-Wörterbücher", die in 114 Sprachen vorliegen, sind eine echte Innovation von Omnipage Pro 11. Der Anwender ist auch in der Lage, Begriffe in von ihm selbst benannte Wörterbücher einzufügen, um den Wortschatz zu erweitern und damit eine effektivere Bearbeitung zu erreichen. Auch die Option, ein Dokument direkt als E-Mail zu versenden, erhöht die Produktivität des Anwenders. Dabei kann entschieden werden, ob die Anlagen zur E-Mail aus einzelnen Seiten oder dem gesamten Dokument bestehen sollen und welches Dateiformat das Dokument haben soll. (hl)

<b>Kurzgefasst</b>

Das Programm Omnipage Pro 11 von Scansoft ist eine professionelle OCR-Anwendung mit ausgezeichnetem Leistungs- und Funktionsumfang. Eine gute bis sehr gute Erkennungsgenauigkeit, eine übersichtliche Benutzeroberfläche, eine leistungsfähige HTML-Ausgabe und die Verarbeitung von PDF-Dokumenten gehören zu den Vorzügen des Programms. Bei der Übernahme der Schriftarten des Originals und bei der Erkennung schlechter Vorlagen sind allerdings Verbesserungen wünschenswert. Daher reicht es nur zur Note Gut.

Anbieter: Scansoft GmbH

Ridlerstr. 11

80339 München

Tel.: 0 89/45 87 35-0

Fax: 0 89/45 87 35-20

www.scansoft.de

Preis: 1.359 Mark (Vollversion)

291 Mark (Update-Version)

Systemvoraussetzungen: Pentium-Prozessor (oder gleichwertig), 32 MB Arbeitsspeicher, Windows 95/98/ME oder NT 4.0/2000.

Wertung:

Software: 1-2

Lieferumfang: 2

Handbuch: 2

Ease-of-Use: 2

Händler-Support: 4

CP-Tipp: 2

(Bewertung nach Schulnoten)

Zur Startseite