Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

03.02.1989

Die Entwicklung der Datenbanktechnologie: DBSM der Zukunft orientiert sich an Objekten

Seit über 20 Jahren ist das Thema "DBMS"

(Datenbankmanagementsysteme) ein zentraler Diskussionspunkt in der Datenverarbeitung. Unsicherheit herrscht, welche Anforderungen noch auf die Datenbanktechnik zukommen.

Insbesondere stellt sich die Frage, wie leistungsfähig der heute aktuelle relationale Ansatz ist.

Der Aufbau eines Informationssystems sollte mit der strategischen Informationsplanung beginnen. Hier werden die Geschäftsziele in Vorgaben für die zu erstellenden Anwendungslösungen auf der strategischen, der taktischen und der operativen Ebene umgesetzt. Die Anwendungen wiederum basieren auf Daten des Unternehmens. Die strategische Informationsanalyse wird nun feststellen müssen, welche Daten benötigt werden. Das Ergebnis wird ein Unternehmensdatenmodell, also die konzeptionelle Sicht auf die Daten des Unternehmens sein. Es muß in einer Enzyklopädie sämtlicher Informationen über die Informationen eines Unternehmens dokumentiert werden. Und damit auch künftige

Informationsanforderungen flexibel erfüllt werden können, empfiehlt sich der Datenbankentwurf mittels konzeptioneller Datenmodellierung (Entity-Relationship-Modelling).

Die Aufgabe der Datenmanagement-Technologie ist es nun, dieses Unternehmensdatenmodell so realitätsgetreu wie möglich abzubilden. Nur so können die Benutzer des Informationssystems Informationen einfach und zuverlässig gewinnen, und nur so wird sich das Informationssystem flexibel der sich ändernden Realität anpassen können. Die realitätsgetreue Abbildung wird um so besser möglich sein, je schärfer die logische Sicht der Daten von den physischen Implementierungsmöglichkeiten getrennt wird.

Zielvorgabe ist die logische Datenunabhängigkeit

Ein erster Schritt in diese Richtung war die einfache Datenunabhängigkeit. Die Daten wurden in einer einheitlichen Datenbasis zentral erfaßt und waren nicht mehr an einzelne Anwendungen gebunden. Diese Unabhängigkeit bestand aber nicht zwischen den Anwendungen und der Datenbankstruktur. Denn bei Änderungen der Datenbankstruktur mußten auch die Anwendungen geändert werden. Die physische

Datenunabhängigkeit war der konsequente, zweite Schritt. Nunmehr wurden die Anwendungen auch unabhängig von physischen Änderungen der Datenspeicherung, etwa dem Hinzufügen von Indizes. Auf dieser Stufe stehen heute viele Datenbanksysteme.

Allerdings: Die Anwendungen sind auf dieser Stufe noch nicht unabhängig von dem zugrundeliegenden Datenbanksystem, das man somit nicht wechseln kann, ohne auch die Anwendungen neu zu entwickeln.

Über die physische Datenunabhängigkeit hinaus muß also auch eine logische realisiert werden, die die Zugriffslogik konsequent von der Physik trennt, also die Anwendungen von verschiedensten Datenbanken unabhängig macht, indem der (lesende oder schreibende) Zugriff auf die Daten über eine logische Datensicht ermöglicht wird.

Solch logische Datensichten können die Anwendungen auch von der Physik der Verteilung der Datenbanken abkoppeln. Die Möglichkeit der rechnerübergreifenden Verteilung unter homogenen

Datenbanksystemen ist heute bereits gegeben. Das umfaßt zum einen Partitionierungen - Datenbankinhalte können nach Feldinhalten verteilt werden-, und Replikationen - Datenbankinhalte werden aus Performancegründen bewußt redundant gehalten.

Beherrschung der Datenunabhängigkeit

Auf der Stufe der logischen Datenunabhängigkeit, also dem Denken in einzelnen Datenfeldern, kann die Kontrolle der

Referenzintegrität endgültig nicht mehr von den Anwendungen selbst übernommen werden. Denn wenn der Anwendungsprogrammierer die zugrundeliegende Tabellenstruktur nicht kennt, da er nur noch in Feldern denkt, dann kann er auch keine Vorkehrungen zur Erhaltung ihrer Konsistenz treffen. Das Datenbanksystem selbst muß also diese Aufgabe vollständig übernehmen.

Der immer höhere Grad der Datenunabhängigkeit bringt es mit sich, daß auch der Bedarf an Informationen über die Daten steigt. Reichten zu Beginn noch kleine Dateien mit Datendefinitionen (Directories oder Kataloge) aus, so sind mittlerweile integrierte Datendiktionäre unabdingbar. Andernfalls ließen sich Anwendungen und Datenbanken auf so hohem logischen Niveau nicht mehr aktiv operativ kontrollieren und steuern.

Relationale Datenbanken stellen nur einen Zwischenschritt auf dem Wege zur bestmöglichen Abbildung der Realität dar. Das relationale Datenmodell ist zwar geprägt von dem Gedanken der einfachen Handhabung und der Datenunabhängigkeit. Die physische Datenunabhängigkeit läßt sich in der Tat auch realisieren, doch die logische ist nur ansatzweise erreicht. Mit der Standardisierung der Datensubsprache SQL haben darauf basierende Datenbanken eine Phase der Konsolidierung erreicht. Damit wird zumindest die potentielle Austauschbarkeit von Datenbanksystemen möglich.

Die Einfachheit des relationalen Modells wurde mit der Zurückführung aller Informationsobjekte auf

zweidimensionale Tabellen "erkauft". Wenn die Zielvorgabe jedoch die möglichst realitätsgetreue Abbildung der Realität ist, dann ist das relationale Datenmodell lediglich eine ungenügende Simplifizierung.

Informationsverlust durch viele kleine Tabellen

So läßt sich etwa ein Industrieroboter als Objekt einer CAD/CAM-Anwendung zwar in der Datenbank in zweidimensionalen Tabellen darstellen. Doch wird das Objekt dann in viele kleine Tabellen zerschlagen was zu einem qualitativen Informationsverlust führt. Durch die Aufteilung in viele verschiedene Datenstrukturen ist jedoch der Gesamtzusammenhang nicht mehr erkennbar, zum Beispiel, daß es sich hier um einen Roboter mit einem Greifarm, einem Standfuß und drei Drehgelenken handelt. Datenbanken müssen also die Konstruktion von mehrdimensionalen Attributen erlauben und die Konsistenz der Beziehungen der Einzelteile solch komplexen Datenobjekte gewährleisten.

Theoretiker diskutieren daher gegenwärtig das NF2-Modell, das die Beschränkungen der relationalen Theorie überwinden soll. Insbesondere geht es auch um die Wahrung der Referenzintegrität in reflexiven Strukturen (ein Roboterbauteil besteht aus mehreren Roboterbauteilen). Dazu müssen natürlich die Beziehungen zwischen den Teilen der Informationsobjekte deutlich erkennbar bleiben und ein integraler Bestandteil der Datenbeschreibung sein. Insbesondere die zweite Anforderung ist kaum zu erfüllen, es sei denn, man wagt einen weiteren Abstraktionsschritt und irnplementiert die Datenbanken auf konzeptionellem Niveau. Das Entity-Relationship-Modell der Informationsanalyse wird dazu direkt in der Datenbank abgebildet und nicht über den Umweghierarchischer oder relationaler Datenbankstrukturen, wodurch sich erhebliche qualitative Informationsverluste ergäben.

Die Überwindung der relationalen Theorie

Ein weiteres Problem für das relationale Datenmodell stellen Texte dar, im Schnitt immerhin 80 Prozent aller Informationen eines Unternehmens. Eine speziell für die Textverwaltung entworfene Software ist nicht geeignet, bei Bedarf die Texte und Daten aus der Datenbank zusammenzuführen. Legt man die Texte jedoch in herkömmlichen Datenbanksystemen ab, so können sie nur eindimensional als lange Zeichenkette abgebildet werden. Texte zum Thema "Industrieroboter mit Greifarm" findet man dann aber aufgrund inhaltlicher Selektionskriterien nicht mehr.

Es muß also möglich sein, Texte als Datenobjekte des Datenbankmanagementsystems aufzufassen. Das bedeutet die integrierte Verwaltung von Texten und formatierten Daten und deren beliebige Verknüpfung. Man muß Texte über ihren Inhalt, über beliebig verbundene Wörter oder Wortteile selektieren können. Dazu muß ein Datenobjekt durch "mehrwertige Attribute" identifizierbar sein, was in der relationalen Theorie nicht zulässig ist.

Die Implementierung des konzeptionellen Modells (Entity-Relationship-Modell) als semantische Datenbank ermöglicht es, komplexe Informationsobjekte auf hohem logischen Niveau in ihrer statischen Integrität zu verwalten. Doch die Integrität eines solchen

Informationsobjekts wird auch durch dynamische Aspekte bestimmt. Es ist etwa denkbar, daß ein Industrieroboter eines bestimmten Unternehmens immer zwei Greifarme hat. Deshalb ist es sinnvoll, in zunehmendem Maße die Anwendung solcher Unternehmensregeln im Sinne der realitätsgetreuen Abbildung in das Datenbanksystem zu verlagern. Damit können Anwendungen dann auf einem objektorientierten Niveau mit noch höherer Datenunabhängigkeit implementiert werden.

Bei der Diskussion um die Datenbanktechnologie wird der tägliche Rechenzentrumsbetrieb häufig ausgeklammert. Und dennoch bestimmt er in zunehmendem Maße den Erfolg jeder auf ihm aufbauenden Anwendungsarchitektur. Er muß also dementsprechend mit den Anwendungen mitwachsen. Tatsächlich sieht es bei Arbeitsvorbereitung und Operating jedoch noch wie zu Beginn der Datenverarbeitung aus. In der Zwischenzeit sind jedoch die Rechnerkonfigurationen immer komplexen geworden, sind zudem Terminalnetze mit Tausenden von Benutzern zu finden und werden Drei-Ebenen-Rechnerarchitekturen aufgebaut.

Daher müssen auch in das Rechenzentrum zukunftsweisende Technologien gebracht werden, damit System-Management und Netzwerk-Management mit Anwendungen bedient werden können, die so produktiv wie andere Anwendungslösungen zu erstellen sind. Dazu ist es natürlich unabdingbar, daß die benötigten Systemdaten so zur Verfügung stehen, wie das bei anderen Daten in einer Datenbank auch üblich ist. Gefordert ist also eine Datenbank der Systemdaten. Darüber hinaus müssen diese Anwendungen auch mit denen des kommerziellen Bereichs integrierbar sein, so daß der Betrieb einer Anwendung in der Anwendung selbst automatisiert werden kann und kommerzielle

Anwendungsentwickler komplizierte Jobnetzwerke gleich miterstellen können.

Jobnetzwerke gleich miterstellen

Das Rechenzentrum kann sich dann wieder stärker auf seine eigentlichen Aufgaben, wie Konfigurationsmanagement und Kapazitätsplanung konzentrieren. Diese Aufgaben des Rechenzentrums sind wiederum durch Komplexität und heuristische Vorgehensweisen charakterisiert, zumal wenn Daten nur partiell verfügbar sind. Da liegt natürlich die Anwendung von regelbasierten Systemen nahe. Weiterhin müssen alle anfallenden Regel- und Steuerdaten einheitlich verwaltet werden. Ein Repository auf Basis eines flexiblen Datenbanksystems stellt somit das Herzstück eines zukunftsorientierten Rechenzentrumsbetriebs dar.

Menschen erkennen ihre Umwelt als unterscheidbare Objekte (Entities) und zwischen ihnen bestehende Beziehungen (Relationships). Heute kann man bereits statische Informationsobjekte und ihre Beziehungen im Sinne einer realitätsgetreuen Abbildung verwalten. Auch Eigenschaften von Beziehungen können vom Datenbanksystem mitverwaltet werden, also etwa "Person A fährt Auto X rasant". Doch die Wirklichkeit kennt noch "schwierigere" Beziehungen, wie etwa "eine Person A liebt eine Person B". Wie jeder weiß, kann diese Art von Beziehung unter Umständen nur eine gewisse Zeit bestehen. Andererseits besteht diese Beziehung in der Regel nur jeweils zwischen zwei Personen zur gleichen Zeit. Datenbanksysteme müssen also auch Zeitaspekte "vernünftig" verwalten und konsistent halten können.

Doch damit nicht genug. Es gibt ja auch Beziehungen der Art "eine Person kauft ein Haus". "Kaufen" steht für eine aktive Beziehung, eine Tätigkeit. So ist die Prozedur "kaufen" zu vollziehen. Diese Art der Geschäftstätigkeit wird derzeit in Anwendungsprogrammen abgebildet. Da aber doch der "Hauskauf", bezogen auf ein Unternehmen, immer ähnlich abläuft, ist es naheliegend, die Pflege dieser aktiven Beziehung (Erhaltung der Integrität) dem Datenbanksystem einheitlich zu überlassen. Ist allerdings die aktive Beziehung "Hauskauf" nicht so eindeutig prozedural zu beschreiben, wie etwa beim Hauskauf aus Spekulationsgründen, so kommen wiederum heuristische Technologien (regelbasierte Systeme-Expertensysteme) ins Spiel. Denkbar ist also auch die Implementierung von aktiven Beziehungen in Form von Expertensystemen. Diese Art von komplexen, dynamischen und aktiven Beziehungen treten auf beliebigen Abstraktionsstufen auf. So gibt es innerhalb des Informationsobjekts "Auto" Integritätsbedingungen zwischen Gewicht und Reifenfülldruck.

Nun entspricht die Abkapselung der Informationsobjekte auf verschiedenen Abstraktionsebenen unter Vernachlässigung des jeweiligen Inhalts menschlichem Wahrnehmungsvermögen und menschlicher Handlungsweise. Deshalb ist es naheliegend, diese Objektorientierung auch zum Gegenstand von zukünftigen Datenbankmanagementsystemen zu machen.