Readiris Pro 11: Texterkennung und Dokumentenmanagement

26.06.2007
Readiris Pro 11 kann Text in über 120 Sprachen erkennen und aus gescannten Dokumenten extrahieren. Doch das ist nicht alles: Die Software erlaubt es dem Kunden auch, die nun elektronisch vorliegenden Inhalte zu indizieren und so einem geregelten Dokumentenmanagement zuzuführen.
Foto: Avanquest

Die Texterkennungssoftware Readiris Pro 11 des belgischen Softwarehauses I.R.I.S. erlaubt es Händlern, eine breite Palette von Kundenwünschen abzudecken. Neben dem privaten Anwender kann der Reseller mit den Produkten vor allem Geschäftskunden ansprechen, die Papierdokumente nicht nur in eine elektronische Form überführen, sondern diese auch in ein geregeltes Dokumentenmanagement integrieren wollen.

Readiris Pro 11 ist in insgesamt sieben verschiedenen Versionen verfügbar. Neben den Standardvarianten für Windows und Mac gibt es für beide Betriebssysteme Readiris-11-Pro-promt-Pakete, die zusätzlich das Übersetzungsprogramm Promt Office in der Version 7 (Windows) beziehungsweise 8 (Mac) enthalten. Dieses kann Texte zwischen Deutsch auf der einen und Englisch, Französisch, Spanisch oder Russisch auf der anderen Seite übersetzen.

Schließlich ist für Mac und PC jeweils eine Corporate Edition erhältlich, die zusätzlich Stapelverarbeitung, Ordnerüberwachung sowie Visitenkartenerkennung mit automatischem Export bietet und mehrsprachige Dokumente verarbeiten kann. Schließlich bietet der Hersteller noch eine Windows Corporate-Edition an, die mit Promt Office gebundelt ist. Ebenfalls Windows-Nutzern vorbehalten bleibt die Indizierung der gescannten Dokumente mit IRIS Desktop Search, da dieses Tool nur in den PC-Versionen verfügbar ist.

Mehr als 70 Verbesserungen

Für die neue Version haben die Entwickler nach eigenen Angaben viel Optimierungsarbeit geleistet und über 70 Verbesserungen und neue Features eingebaut. Die OCR-Engine soll um 20 Prozent schneller und um 30 Prozent genauer als die der Vorgängerversion sein. Der Nutzer kann nun wählen, ob er bei der Texterkennung Schnelligkeit oder Genauigkeit präferiert. Die Engine erkennt in der Windows-Version Texte in 126 Sprachen, bei der Mac-Variante sind es 118. Optional stehen Module für Hebräisch sowie für asiatische Sprachen zur Verfügung.

Neben gedruckten Texten kann das Tool laut Anbieter auch handschriftliche Notizen erkennen. Damit die Digitalisierung aber einigermaßen funktioniert, muss sich der Nutzer strikt an die Schriftvorgaben des Programms halten. Interessanter für den professionellen User ist da schon die integrierte Barcode-Erkennung. Damit die Software allerdings den Code vom Text unterscheiden kann, muss der Nutzer einen Rahmen um den Bar Code ziehen. Die im Strichcode enthalten Information wird dann automatisch in das exportierte Dokument geschrieben. Readiris kann über 20 verschiedene Bar-Code-Typen unterscheiden.

Auch die Benutzeroberfläche soll besser und intuitiver bedienbar sein. Der Anwender aus dem Windows-Umfeld kann dabei zwischen 21 Menüsprachen wählen, Mac-Nutzer müssen sich mit sechs Sprachen zufrieden geben.

Readiris kann per Twain-Treiber direkt auf einen Scanner zugreifen oder übliche Bildformate wie Jpeg, BMP oder Tiff sowie PDF-Dokumente öffnen. Das Programm unterstützt selbst relativ exotische Format wie DjVU und JPEG 2000 und kommt auch mit mehrseitigen Dokumenten zurecht. Die verbesserte Autoformat-Technologie übernimmt dabei nicht nur den Text sondern erhält soweit als möglich auch die Formatierung der Vorlage. Dank der neuen Unterstützung für Microsoft SpreadsheetML soll auch die Reproduktion von Tabellen in Excel 2003 kein Problem darstellen. Für den Export nach Word steht nun das WordML-Format zur Verfügung, das gegenüber dem üblicherweise verwendeten RTF mehr Editier- und Formatiermöglichkeiten bietet. Für den PDF-Output gibt es in Version 11 vier verschiedene Möglichkeiten: Text über Bild, Bild über Text, nur Text oder nur Bild.

Will der Kunde große Dokumentenmengen erkennen und archivieren lassen, sollte der Händler zur Corporate Edition raten. Sie erlaubt es Dokumente im Stapel zu verarbeiten. Fügt der Anwender eine leere Seite zwischen die Vorlagen ein, erkennt Readiris diese und erstellt automatisch einen neuen Output-File. Alternativ lassen sich gescannte Dokumente auch über ein Kontextmenü manuell separieren. Informationen aus Bar Codes speichert die Corporate Edition direkt in einem XML-Index.

Die Profi-Variante kann außerdem einen Ordner überwachen. Legt der Nutzer eine neue Datei in diesem Ordner ab, wird sie von Rediris automatisch umgewandelt. Schließlich kann die Unternehmensversion noch Visitenkarten erkennen und deren Inhalte automatisch in Outlook, Outlook Express, Lotus Notes oder Palm Desktop ablegen. Alternativ lassen sich die Informationen strukturiert (zum Beispiel Komma-separiert), als vCard oder HMTL-Datei speichern.

Readiris ist in allen Varianten ab sofort über Avanquest verfügbar. Preise und Systemvoraussetzungen entnehmen Sie bitte der Tabelle. Für den Fachhandel bietet Avanquest außerdem ein Lizenzprogramm, das je nach Volumen bis zu 35 Prozent Rabatt bietet. (haf)