Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

10.10.1986 - 

Mittelfristig sollten Anwender den Markt der ODA-Produkte aufmerksam verfolgen:

DCA/DIA versus X.400 - Freunde oder Feinde?

In den letzten Jahren wurde eine Reihe von Standards entwickelt, die den Austausch von elektronischen Dokumenten erleichtern sollen. Zuerst veröffentlichte IBM seine Document Content Architecture (DCA) und Document Interchange Architecture (DIA). Disoss war das erste IBM-Produkt, das diese beiden Architekturen implementierte. Im Jahre 1984 verabschiedete CCITT unter dem Kürzel X.400 einen Internationalen Standard für Elektronische Post. Zur Zeit ist die International Standards Organisation (ISO) damit beschäftigt, eine Office Document Architecture (ODA) und ein Office Document Interchange Format (ODIF) in der ersten Version festzulegen.

Die computergestützte Behandlung von Dokumenten ist Grundlage jeder Automatisierung mittlerer und größerer Büros. Erst dieser Dienst ermöglicht die umfassende Realisierung sinnvoller Anwendungen.

Die Behandlung von Dokumenten beinhaltet drei Funktionen:

- Bearbeitung (Editieren, Formatieren. . . ),

- Übertragung zwischen Computern (Electronic Mail),

- Archivierung.

Da die Behandlung von Dokumenten bei größeren und großen Anwendern in der Regel auf mehreren unterschiedlichen Systemen erfolgen muß (Großrechner, Minicomputer, Arbeitsplatzrechner, Textsysteme), besteht ein großer Bedarf an Dokumentenstandards. Eine Reihe solcher Standards, die die obigen Funktionen beinhalten, wurden in den letzten Jahren insbesondere von IBM und internationalen Standardisierungsgremien definiert.

Die verschiedenen Standards überlappen sich allerdings zum Teil in ihrer Funktionalität, in mancher Hinsicht ergänzen sie sich jedoch. Wird hier eine neue Runde "IBM gegen den Rest der Welt" eingeläutet?

Dieser Beitrag versucht, das Thema etwas transparenter zu machen. Die relevanten Standards werden beschrieben und ihre Leistungsmerkmale werden einander gegenübergestellt. Den Abschluß bildet die Beschreibung der Situation sowohl des DV-Herstellers als auch des Anwenders.

Die Definition des Begriffs Dokument ist in der Literatur unterschiedlich. So steht er zum Beispiel einmal für all die benutzergenerierte Information, die durch und zwischen Bürosystemen fließt /IBM83/. An anderer StelIe ist ein Dokument eine Menge von

Informationen, die für den Menschen verständlich ist und die in einer Anwendung als Einheit ausgetauscht, abgelegt, oder verarbeitet wird /KRÖ84/. Einigkeit besteht auf jeden Fall hinsichtlich der Benutzerorientierung der Daten und darüber, daß der Begriff weiter gefaßt ist als das allgemeine Verständnis von einem Dokument.

Die elektronische Behandlung von Dokumenten liegt an der Nahtstelle zwischen Anwendung und Datenübertragung. Erst der Austausch von Dokumenten zwischen Computern bringt es mit sich, daß diese mittels unterschiedlicher Editoren bearbeitet werden müssen. Dies erfordert die Verwendung einer einheitlichen Dokumentenstruktur oder -architektur.

Dabei versteht man unter einer Architektur eine Menge von Entwurfsprinzipien, die die Beziehungen und Interaktionen zwischen verschiedenen Teilen eines Systems oder Netzwerks von Systemen definieren /IBM83/.

Neben der Struktur der Dokumente selbst sind Mechanismen erforderlich, um ein Dokument an einen beliebigen Empfänger über ein Netzwerk zu übermitteln. Teletex und Elektronische Post sind zwei der

bekanntesten Verfahren. Auf Teletex soll wegen der beschränkten Funktionalität nur am Rande eingegangen werden.

Auch der Zugriff von unterschiedlichen Computern auf zentrale Archive erfordert die Festlegung von Standards. So müssen die Operationen auf dem Archiv und die mit den Dokumenten abzuspeichernde Information einheitlich sein.

Aufwendiges Unterfangen

Die Festlegung einer Dokumentenarchitektur ist ein besonders schwieriges und aufwendiges Unterfangen. So sind zunächst einmal zwei zum Teil im Konflikt stehende Anforderungen zu erfüllen:

- optimaler Zugriff und optimale Verarbeitung,

- optimale Übertragung.

Die Lösung dieses Konflikts besteht in vielen Fällen darin, daß zum Beispiel ein Editor eine interne optimale Abspeicherung eines in Bearbeitung befindlichen Dokuments verwendet und diese erst nach Abschluß der Bearbeitung in die standardisierte externe Form umwandelt.

Weitere Anforderungen an eine umfassende Dokumentenarchitektur sind:

- die Definition von Komponenten und deren Eigenschaften einschließlich der Relationen zwischen den Komponenten,

- die Definition von Mitteln zur Steuerung und Kontrolle von Strukturen,

- eine Zukunftsorientierung (insbesondere Erweiterungsfähigkeit bezüglich neuer Dokumenteninhalte),

- die mögliche optimale Verwendungsmöglichkeit einfachster bis komplexester Editoren.

Die Anforderungen an die Übertragung und Archivierung sind ähnlich komplex. So muß zum Beispiel die Übertragung die Verwendung von Verteinerlisten, Empfangsbestätigungen und personenorientierter Adressierung (Telex/Teletex: geräteorientiert) ermöglichen. Bei der Archivierung müssen sowohl zentrale wie auch dezentrale Speicherung möglich sein. Datenschutz und leichtes Auffinden abgelegter Dokumente sind zu unterstützen.

IBM veröffentlichte zuerst

Was die bedeutenden Architekturen betrifft, so veröffentlichte zuerst IBM 1983 seine Document Content Architecture (DCA) und Document Interchange Architecture (DIA). DISOSS war das erste IBM-Produkt, das diese beiden Architekturen implementierte.

Im Jahre 1984 verabschiedete CCITT unter dem Kürzel X.400 einen internationalen Standard für Elektronische Post. Im April 1986 hat die International Standards Organization (ISO) in enger Zusammenarbeit mit der European Computer Manufacturers Association (ECMA) die Office Document Architecture (ODA) und das Office Document Interchange Format (ODIF) als Draft International Standard DIS 8613 verabschiedet.

Funktionalität der Architekturen

Die genannten Architekturen sollen im folgenden zuerst getrennt und dann im Vergleich beschrieben werden. ODA/ODIF und DCA sind die eigentlichen Dokumentarchitekturen einschließlich der Austauschformate. X.400 und DIA regeln die Übertragung von Dokumenten. Darüber hinaus bildet DIA die Basis für standardisierte Archivierung.

Die Behandlung der einzelnen Standards ist entsprechend der Funktionalitätsgruppierungen strukturiert.

Office Document Architecture

Der ECMA-Standard- 101 und ISO DIS 8613 unterscheiden sich nur geringfügig. Diese Beschreibung basiert auf dem ECMA-Standard /ECM85/.

ODA ist eine mächtige Architektur, die sowohl eine komplexe Struktur eines Dokuments als auch ein abstraktes Bearbeitungsmodell für Dokumente beinhaltet.

Dokumentenstruktur

Ein Dokument besteht zuerst einmal aus dem Inhalt. Jede Art von Inhalt wird durch eine eigene Inhaltsarchitektur definiert, die zum Beispiel Kontrollzeichen für Fettdruck, Unterstreichung und möglichen Zeilenumbruch aufweist.

In der derzeitigen Version des Standards sind nur zwei Inhaltsarchitekturen zugelassen. Dies sind die Charaster Content Architecture und die Photographic Content Architecture. Diese Architekturen definieren keine Zeichen zum Beispiel für den Beginn eines Absatzes oder einen Seitenumbruch. Solche Funktionen werden mittels zweier getrennter objekt- und baumorientierter Strukturen erfaßt.

Die logische Struktur eines Dokuments wird durch einen Baum von logischen Objekten gebildet, dessen Wurzel das Objekt vom Typ Dokument bildet. Die Blätter des Baumes sind logische Basisobjekte, die jeweils auf ein oder mehrere Stücke des Inhalts verweisen. Dazwischen

liegen möglicherweise mehrere Ebenen zusammengesetzter logischer Objekte.

Jedes Objekt gehört einer Objektklasse an. So können zum Beispiel die logischen Basisobjekte eines Dokuments Abschnitte und die zusammengesetzten logischen Objekte Teile und Kapitel sein. Auch das Dokument selbst kann von einer bestimmten Klasse sein. Jedes Objekt der logischen Struktur verfügt über eine Reihe von Attributen, die zum Beispiel den Objekttyp, die Eigenschaften und die Unterstruktur des Objekts beschreiben. Darüber hinaus machen sie Aussagen über die Darstellung der untergeordneten Inhaltsstücke und beschreiben Relationen zu anderen Objekten unter Umgehung der hierarchischen Baumstruktur (zum Beispiel Referenzen und Fußnoten).

Die logischen Objektklassen werden durch frei spezifizierbare logische Definitionen beschrieben. Diese legen fest, welche Attribute mit

welchen Werten ein Objekt dieser Klasse haben darf. Das gilt ebenfalls für die Dokumentklasse, für die darüber hinaus bestimmten Inhaltsstücke (zum Beispiel Firmenlogo) fest vorgegeben werden können.

Dieses Konzept von Objekt- und Dokumentklasse ermöglicht die Realisierung angepaßter Werkzeuge. Ein allgemeiner Editor liest bei Beginn der Bearbeitung eines Dokuments auch die dazugehörigen Definitionen ein. Der Benutzer wird dann beim Editieren sehr stark entsprechend der Dokumentklasse geführt, was ihm die Arbeit erleichtert, aber auch verhindert, daß die definierte Struktur aller Dokumente dieser Klasse verletzt wird.

Auch die Layout-Struktur eines Dokuments ist ein Baum, bestehend aus Objekten vom Typ Dokument, Seitenmenge, Seite, Rahmen und Block. Die Objekte verfügen ebenfalls über Attribute und sind durch Objektklassen genauer spezifiziert. Aufgabe der Layout-Struktur ist es, die Darstellung des Dokuments zusammen mit den Kontrollzeichen im Inhalt zu steuern.

Die Beziehung zwischen den beiden Strukturen und dem Inhalt ist aus dem nachfolgenden Bild ersichtlich.

Vergleichende Analyse

Ausgehend von den Anforderungen, die an eine computergestützte Behandlung von Dokumenten gestellt werden, werden die relevanten Standars des DV-Marktführes mit den internationalen Standars auf diesem Gebiet verglichen. Um einen solchen Vergleich zu ermöglichen, werden diese Standards zunächst einmal einzeln beschrieben.

Die vergleichende Analyse führt zu dem Ergebnis, daß IBM-Standards und internationale Standards nicht kompatibel zueinander sind und sich in ihrer unterscheiden. Abschließend werden die Situation der Hersteller und der Anwender in diesem Umfeld aufgezeigt.