Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

10.04.1981 - 

Relationale Datenbank für kommerzielle Anwender auf VAX-Basis:

DB-Lösung muß DV-lgnoranten befriedigen

HANNOVER - Das Jahrzehnt der Rechnernetze könnten die 80er Jahre bei einer Rückschau genannt werden, meint Manfred Bues, Professor für Wirtschaftsinformatik an der Fachhochschule Furtwangen. Wachsende Anwenderforderungen nach Unabhängigkeit auf dem Software-Sektor erforderten auch neue Formen der Datenorganisation. Solchen Formen, glaubt Bues, sei man mit dem DB-Produkt eines Freiburger Softwarehauses näher gekommen. Im folgenden Beitrag befaßt der Autor sich auch mit allgemeinen Überlegungen zu relationalen Datenbanken.

Die hinter uns liegenden 70er Jahre sind in der Informationsverarbeitung durch einen (keineswegs abgeschossenen) Dezentralisierungsprozeß gekennzeichnet. Wichtige Etappen dieser Entwicklung sind in chronologischer Folge diese:

- Zugriff auf zentrale Host-Systeme über nicht-intelligente Terminals,

- Zugriff auf zentrale Host-Systeme über intelligente Terminals,

- halbautonome Systeme an zentralen Host-Systemen (abhängig vom Host, jedoch temporär autonom arbeitsfähig),

- autonome Systeme ("stand-alone" Minis und Mikros),

- autonome Systeme in Netzen

Die beiden letztgenannten Schritte sind nicht abgeschlossen: Die autonomen Systeme gewinnen an Bedeutung, weil immer mehr (Hardware)Leistung bei gleichbleibenden Kosten und sinkendem Raumbedarf geboten wird.

Damit steigen für den dezentralen (eigentlichen) Anwender die Möglichkeiten - und seine Wunsche und Ansprüche. Hinsichtlich der Netzwerke stehen wir erst am Anfang einer längeren Entwicklung. Es könnte durchaus sein, daß bei einer Rückschau auf die 80er festgestellt wird, es sei das Jahrzehnt der Rechnernetze gewesen.

Die fortschreitende Dezentralisierung wird immer massiver Anwenderforderungen nach mehr funktionaler Unabhängigkeit von zentralen Einrichtungen aufkommen lassen. Konkret: Der Anwender wird nicht damit zufrieden sein, seine "eigene" Hardware zu haben, sondern er wird vielmehr fordern (müssen!!?), auch in der Benutzung (sprich: Realisierung von lnformationswünschen) nicht mehr ausschließlich auf zentrale Programmierkapazitäten angewiesen zu sein.

Dieser Wunsch laßt sich nicht dadurch erfüllen, daß wir ein Volk von Programmierern werden. Die Lösung kann nur darin bestehen, die Benutzung eines dezentralen Rechners so einfach zu machen, daß es nicht eines Informatikstudiums bedarf, die gewünschten Informationen dem System zu entlocken. Ein konkreter Lösungshinweis: Benutzerspezifische Meta-Sprachen und neue Formen der Datenorganisation .

Wir wollen uns hier mit der Datenorganisation naher befassen: Um dem Anwender mehr Beweglichkeit in der Festlegung und Erfüllung seiner Informationswunsche zu bieten, werden wir Datenbanksysteme (DBS) einsetzen müssen, die mindestens in zweierlei Hinsicht wesentliche Verbesserungen zu den heute marktbeherrschenden DBS bieten.

Ohne sich an dieser Stelle mit techno-spezifischen Einzelheiten befassen zu müssen, lassen sich die im Zuge fortschreitender Dezentralisierung aufkommenden Anforderungen an künftige DBS ganz allgemein so zusammenfassen:

- sie müssen einfacher und schneller bei ihrer Einrichtung (Erstaufbau) werden;

- sie müssen vor allem für den Nicht-EDVer bedeutend einfacher in der Handhabung werden;

- die Flexibilität in der Benutzung muß wesentlich verbessert werden, da die künftigen Informationswunsche nicht vollständig beim Aufbau der Datenbank definiert werden können.

Die heute vorherrschenden DBS weisen gerade im Hinblick auf die obigen Anforderungen Eigenschaften auf, die bisweilen schlicht als unerträglich bezeichnet werden müssen Nicht ohne Grund setzt sich eine neue Spezies von DBS auf immer breiterer Front durch. Gemeint sind relationale Datenbanksysteme (nach dem Coddschen Relationenmodell). Aktuelle Ereignisse zeigen, daß sich selbst bisher standfeste Verfechter hierarchischer DBS den neuen Forderungen nicht verschließen können.

Relational ist günstiger

Die Leistungsfähigkeit einer relationalen Datenbank soll am Beispiel von Data 600 dargestellt werden. Data 600 ist ein relationales DBS (RDBS), das die Freiburger Datanorm Software GmbH für die VAX-Familie entwickelte. Die mit Data 600 bis heute vorliegenden Erfahrungen zeigen, daß eine RDBS die obengenannten Forderungen besser erfüllen kann als eine herkömmliche hierarchische Datenbank .

Die Einfachheit des Aufbaus wird durch die vollkommen andere Architektur eines RDBS ermöglicht. Data 600 versucht die uralte Forderung nach möglichst hoher Datenunabhängigkeit zu realisieren. Datenunabhängigkeit bedeutet, der Benutzer möge sich weder um physikalische Dateneigenschaften noch um Zugriffspfade kümmern müssen.

Er soll mit den logischen Eigenschaften seiner Daten und den daraus resultierenden Informationswünschen befaßt sein. Bei der Einführung des Freiburger Softwarepaketes ist der Benutzer mit physikalischen Eigenschaften der in die DB einfließenden Daten nur beim Aufbau einer sogenannten Attributdatei befaßt. Dies ist eine Datei, in der die (physikalischen) Eigenschaften für den Anwender überhaupt eine Rolle spielen.

Datenfelder nach Benutzerwünschen

Die übrigen Aufbauarbeiten sind dann schon ausschließlich logischen Eigenschaften der aufzubauenden Datenbank gewidmet: Es müssen Relationen definiert werden. Eine Relation ist nichts anderes als eine logische Zusammenfügung von "Datenfeldern" (Attributen) nach Maßgabe von Benutzerwünschen. Man kann den Relationsbegriff auf einen griffigen Nenner bringen: Die Felder in einer Listenüberschrift sind letztlich auch nichts anderes als eine Relation.

Mit dem Aufbau der Attributdatei und der Definition der gewünschte Relationen ist aus Benutzersicht der Aufbau der RDBS schon beendet. Fragen der Datensegmentierung, der Speicherungsform und der geeigneten Zugriffsverfahren spielen in relationalen Datenbanken keine Rolle.

Noch ein Aspekt des Aufbaus: Die ursprünglichen Dateien werden nicht verändert. Das Organisationsschema der RDBS liegt gleichermaßen als Meta-Organisation über der vorhandenen Organisation. Daraus resultiert ein wichtiger Vorteil: Vorhandene Programme, die nicht DB orientiert sind, können unverändert weiter benutzt werden.

Der Übergang auf eine RDBS wird damit nicht eine (meist abenteuerliche) Totalumstellung der vorhandenen Datenbasis, sondern eine Ergänzung des Vorhandenen. Der Wirkungskreis des RDBS kann ganz allmählich großer gezogen werden .

Ein Blick auf die Architektur von Data 600 macht deutlich, wie diese Vorteile erreicht werden können. Die Zugriffe auf die vorhandenen Dateien werden über (als invertierte Dateien ausgeprägte) Bitlisten realisiert, die in der Benutzung als binäre Bäume behandelt werden. Das einzelne Bit in einer solchen Liste stellt die relative Adresse des Satzes in der Datei dar.

Der eigentliche Zugriff erfolgt über das standardmäßige Record Management System (RMS) des Betriebssystems. Damit das Auffinden bestimmter Informationen schnell vonstatten geht, sind die Bitlisten komprimiert worden: Lange Sequenzen von L oder O Bits werden kurzerhand zusammengeschoben.

Abfragesprache nicht neu

Zur Einfachheit für den Benutzer: Moderne DBS werden in einem Dialogumfeld benutzt. Dem Benutzer im Sinne der Fachabteilung muß die Gelegenheit gegeben werden, ohne fremde Hilfe Anfragen an die Datenbank zu formulieren. Data 600 verwendet dazu eine spezielle Abfragesprache (Query Language). Solche Query Languages (QL) sind keineswegs eine Neuigkeit; neu bei der Datanorm-Software sind diese Eigenschaften: Die bei dieser RDBS eingesetzte QL besitzt keine eigene Syntax. Anwender muß also keine Quasi-Programmiersprache erlernen, wie das bei vielen anderen QL der Fall ist. Er wählt vielmehr die Relation aus, mit der er arbeiten will. Der Rest wird lediglich mit zwei Symbolen erledigt.

Die QL ist so an der Denk- und Ausdrucksweise des Anwenders ausgerichtet, daß nach den bisherigen Erfahrungen eine Einweisung von rund zwei Stunden genügt, bis auch DV-ignorante Benutzer Anfragen an das System formulieren können. Die allermeisten bisher vorhandenen QL verwenden eine spezielle Syntax; der Anwender muß sich also mit einer speziellen "Programmiersprache" auseinandersetzen.

Neue Fragestellungen

Durch die Art der in Data 600 gewählten Zugriffstechnik (Binäre Bäume in invertierten Dateien) ist es bei der Generierung nicht erforderlich, s vorkommenden Zugriffspfade physikalisch zu definieren und zu realisieren. In einem RDBS kommuniziert der Benutzer immer nur über die Relation mit den Daten.

Die Relation steht nun aber keineswegs isoliert da, sondern es besteht die Möglichkeit, mehrere Relationen miteinander zu verknüpfen. Damit lassen sich immer wieder neue Fragestellungen formulieren, die beim Aufbau der RDBS nicht bekannt gewesen sein müssen.

Beim Verknüpfen von Relationen werden die Bitlisten der beteiligten Relationen mit Boolschen Operationen "übereinander" gelegt. Zugegriffen wird dann physikalisch nur auf jene Sätze, die das Sieb dieser Logischen Selektionen durchdrungen haben. Also: Zugriff nur auf jene Sätze, die für die gestellte Anfrage auch wirklich von Bedeutung sind. Dies klärt einen Teil des ungewöhnlich guten Antwortzeitverhaltens eines RDBS.

Herkömmliche Datenbanken, die in den Zugriffen mit Pointern und Ketten arbeiten, müssen oftmals lange Folgen von Sätzen "abklappern", um anhand des Inhaltes festzustellen, ob der gelesene Satz für die Anfrage von Bedeutung ist.

Sätze abklappern

Flexibilität für den Data 600 Benutzer ergibt sich zudem aus der Möglichkeit, die Feldfolge seiner Ausgabe, die Sortierfolge und das Medium (Bildschirm oder Drucker) wählen zu können. Neben der QL steht ein Report Writer zur Verfügung, der (mit der Möglichkeit zur Definition eigener Rechenoperationen ausgestattet) dem Anwender zusätzliche Möglichkeiten zur Artikulierung seiner Wünsche bietet.