Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

28.10.1983 - 

Software-Systeme für verteilte Datenverarbeitung sind noch selten:

Hol- und Bringschuld liegen im Wettstreit

Seit Datenverarbeitung auch in kleinen Einheiten wirtschaftlich geworden ist, geht der natürliche Trend zur verteilten Datenverarbeitung. Denn nichts ist vernünftiger, als Daten dort zu verarbeiten, wo sie anfallen. Fritz Jörn, Pressesprecher der Tandem Computers GmbH aus Frankfurt, behandelt in seinem Beitrag Grundsätzliches zum Thema verteilte Datenbanken und Nachrichtensysteme.

Schon früher, bei Systemen ohne Computer, haben kleine, überschaubare Organisationseinheiten die effizienteste Datenverarbeitung geleistet: So wurden Meldedaten beim örtlichen Polizeirevier geführt, denn das Revier war der primäre Kontaktpunkt zum Bürger, der sich an- oder abgemeldete oder seinen Ausweis verlängert haben wollte. Benötigte eine andere Dienststelle Auskunft, so wurde beim lokalen Register angefragt. Datenverarbeitung ist heute das Abbilden der Wirklichkeit auf Magnetplatten. Faktische Veränderungen oder hypothetische Voraussagen werden dann durch Rechenzugriff auf dieses Modell vorgenommen. Deswegen gehören Daten dorthin, wo die Fakten sind, müssen aber allgemein leicht zugänglich bleiben. Die Daten finden sich in mehr oder weniger lose gekoppelten Systemen: auf verschiedenen Floppies verschiedener Textverarbeitungssysteme, wie etwa in verteilten Arbeitsplatzcomputern, aber auch auf Minicomputerstationen oder Rechnern mittlerer Größe, die ihrerseits viele Terminals mit und ohne Intelligenz bedienen.

Softwaresysteme zur Bearbeitung verteilter Daten sind immer noch selten. Sie bauen auf Datenbanksystemen auf, deren Hauptvorteil Flexibilität im Aufbau und in der Änderung der Datenstrukturen und der Abfrage sind, und sie brauchen sichere Computernetzwerke. Da diese Datenbanksysteme typischerweise auf jedem Rechner unterschiedlich sind - nicht nur, was die Benutzerdaten und -dateien betrifft, sondern eben die Datenbanklogik - sind Datenbanken selbst mit einem verteilbaren Datenbank-Managementsystem immer nur auf Computern desselben Herstellers ablauffähig. Das schließt nicht aus, daß in einem Netz auf Daten eines anderen angeschlossenen Rechners zugegriffen werden kann. Jedoch ist dieser Zugriff wesentlich umständlicher und erfordert "liebevolle" Programmierung, die ja gerade durch Datenbank-Abfragesprachen ("Query-Languages.") vermieden werden soll. Diese Situation wird aber schon wegen der unterschiedlichen Größe der Computersysteme in der Praxis noch lange so bleiben.

Die eigentliche Datenbankabfrage in einem verteilten System mit einer verteilten DB-Software läuft so ab, daß es dem Benutzer nicht auffällt (außer vielleicht verändertem Zeitverhalten), daß die Daten erst aus mehreren Systemen geholt werden müssen: Ein vom System selbst erstelltes und mitgeführtes, auf das Netz erweitertes Data Dictionary hilft dem System, die Dateien zu lokalisieren, ohne daß der Anfragende sich darum zu kümmern braucht. Tandem Computers hat die Erfahrung gemacht, daß sich eigentlich nur relationale Systeme flexibel verteilen lassen, da keine Datei-Querverweise netzweit geführt werden müssen.

Bei der Anfrage an die verteilte Datenbank nach dem Prinzip der Holschuld (Abb. 1) wird zur Zeit t1 der Zustand der Daten an den verschiedenen Orten zu gleicher Zeit beziehungsweise zu möglichst gleicher Zeit ausgewertet. Schon um dem Fragenden eine rasche Antwort zu geben. Beispiele sind etwa die Suche nach Ersatzteilen oder Fertigungsanweisungen in mehreren Lägern oder Fabrikationsstätten oder die Addierung liquider Mittel mehrerer Geschäftsbereiche. Diese netzweiten Abfragen für gleichzeitige Informationen sind aber erstaunlicherweise in der Praxis selten.

Info als Holschuld

Zunächst ist vielen Anwendern nicht bekannt, daß netzweite Abfragen ohne besondere Programmierung genauso wie vor Ort möglich sind. Dann hängt die Dauer einer Anfrage im Netz sehr stark vom Übertragungsweg ab. Zuletzt aber vermute ich organisatorische Gründe: Bei der Abfrage geht man nämlich davon aus, daß der Anfragende sich seine Information selbst holt.

Beim Holschuld-Prinzip müssen nicht nur alle Daten tatsächlich dem Datenbankformat gerecht gespeichert sein, sie müssen auch zu jeder Zeit tatsächlich die Wirklichkeit widerspiegeln. Das ist bei maschinell erfaßten Daten, wie etwa bei Lagerbeständen in einem Hochregallager, sicher zu erreichen, bei Terminaldaten aber oft nicht gegeben. Denn "hinter" jedem Terminal sitzt nun mal ein Mensch; und der hat vielleicht gerade diese Daten noch nicht eingegeben. Monats- oder Bilanzabschlüsse ließen sich ohne Vorwarnung auf diese Methode nicht durchführen.

Andere Aspekte zeigt das Prinzip der Bringschuld auf. Hier läuft eine Bewegung von Informationen durch das Netz (Abb. 2). Zur Zeit t1 sendet Ort A eine Nachricht aus, die B und C betrifft. Dann schickt zum Zeitpunkt t2 Ort B eine Nachricht an A und so fort. Diese Informationen lösen zusammen mit Vorgängen in der Wirklichkeit immer wieder neue Nachrichten aus.

So lassen sich ganze Nachrichtenketten anstoßen, ohne daß der am Anfang der Kette stehende dauernd "am Hörer bleibt". Dieses Verfahren hat Vorteile, wenn es darum geht, reale, zeitverzögerte Vorgänge in Computernetzen darzustellen, oder auch nur Vorgänge, die sachliche "Gleichzeitigkeit" eher brauchen als chronologische. Es erlaubt auch baut man die Nachrichten nur einfach genug auf - die Kopplung von Systemen aller Arten und Größenordnungen. Grundsatz dieses Nachrichtenverfahrens ist aber immer das Prinzip der Bringschuld: Wer etwas zu sagen hat, der meldet es auch.

Die Vorteile des Verfahrens, besonders im Verhältnis zur direkten Abfrage einer verteilten Datenbank, zeichnen sich ab:

- Zeitliche Entkopplung ist möglich. Nach Absetzen der Meldung muß auf den Empfang nicht gewartet werden. Bei wichtigen Meldungen kann ja durch eine neue Nachricht der Empfang bestätigt werden.

- Meldungen können Vorgänge auslösen, was rein passive Abfragen nicht können.

- Unterschiedliche Systeme können verbunden werden, denn nicht die Daten müssen zueinander passen, sondern nur die Nachrichtenformate.

- Computerressourcen können der Wichtigkeit und Eile der Nachricht angepaßt werden.

- Das Prinzip "Bringschuld" fördert ordentliches Arbeiten im buchhalterischen Sinne, denn die Informationen sind sozusagen vom Versender unterschrieben, nicht per Holzugriff hinterrücks eingeholt.

Natürlich hat das Verfahren der Bringschuld auch Nachteile. Dazu zählt die logische Verteilung der Nachrichten, so die Verteilerliste ("Wer muß davon wissen?"), und die Unmöglichkeit, Unerwartetes abzufragen. Banken werden sicher nicht jede Kontostandsänderung per Nachricht an alle verbundenen Systeme mitteilen, sondern nur berechtigte Anfragen (Holschuld) bearbeiten.

Im wesentlichen aber bildet das Nachrichten- oder Bringschuld-Verfahren die Dynamik der Wirklichkeit besonders gut ab, während statische Situationen (Daten-"Bank") in verteilten Datenbanken besser aufgehoben sind.

Die Verfahren von gleichzeitiger Abfrage und das von Nachrichten ergänzen sich. Eines von beiden (oder eine Mischform) muß bei verteilter Datenverarbeitung eingesetzt werden, und nicht nur dort: Alle Kommunikationsprobleme und organisatorischen Maßnahmen sollten einmal unter diesem Aspekt durchleuchtet werden.