Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

14.05.1982 - 

Ein methodischer Weg für den Datenbankentwurf:

Über kanonische Struktur zum DB-Design

Die heute bestehende und eingesetzte Anwender-Software deckt im wesentlichen lediglich die operationale Ebene in einem Unternehmen ab. Die planerische strategische Ebene wird derzeit noch kaum von DV-Systemen unterstützt. Das größte Handicap auf dem Weg zu komplexen Informationssystemen besteht in der fehlenden lntergration der Anwendungs-Software.

Die Voraussetzung für die Konzipierung einer zukunftsorientierten betrieblichen Informationsverarbeitung, die in einer homogenen Einheit sowohl die operationalen als auch darauf aufbauend die informativen Bedürfnisse abdeckt, ist die Konzipierung einer integrierten Datenhaltung.

Auf der Basis eines leistungsfähigen Datenbank-Management-Systems stellt sie letztendlich den zentralen Baustein dar.

Im Bereich der Systementwicklung haben sich in den letzten Jahren methodische ingenieurmäßige Vorgehensweisen durchgesetzt und das bislang weitgehend intuitive Vorgehen der Organisatoren und Programmierer abgelöst. Für den Bereich des Datenbankentwurfs fehlten derartige Vorgehensweisen noch.

Die Methode der kanonischen Datenstruktur*) schließt diese Lücke.

Grundgedanke der Methode ist die Gliederung des Entwurfsprozesses in drei Schritten:

- konzeptioneller Entwurf;

- systemspezifischer Entwurf;

- physischer Entwurf.

Es wird ein Weg aufgezeigt ausgehend von den Forderungen der Anwendungen, systematisch zu einer im Sinne eines Gesamtnutzens optimalen Datenbankstruktur zu, gelangen. Die Vorgehensweise ist in Abbildung 1 dargestellt.

Datenspezifische Anwendungsanalyse

Voraussetzung für eine an den Bedürfnissen der Anwendungen orientierte Datenstruktur ist die Analyse der datenspezifischen Anforderungen. Es hat sich als nützlich erwiesen, daß Vertreter der Fachabteilungen und der DV-Abteilung gemeinsam einen Datenelementkatalog, einen Anwendungskatalog und einen Zuordnungskatalog erarbeiten.

Der Datenelement-Katalog enthält Angaben über die Elementbezeichnung, die größte und durchschnittliche Elementlänge, das Format sowie das minimale, maximale und durchschnittliche Vorkommen in Bezug zu anderen Elementen. Diese Angaben werden benötigt, um bei dem Übergang von konzeptionellen zum systemspezifischen DB-Design optimale Satztypen (Segmente) zu bilden.

Wesentliche Erkenntnisse bei der Umsetzung zum DBMS-spezifischen Design gewinnt man aus der Analyse der Verarbeitungsanforderungen. Deshalb wird für jede Anwendung der datenspezifische Ablauf in einem Anwendungskatalog beschrieben. Wichtige Angaben hierbei sind Antwortzeitanforderungen, Häufigkeit, Periodizität und Datenvolumen.

Der Zuordnungskatalog schließlich beschreibt die Art und Weise und Verwendung von Datenelementen je Anwendung.

Konzeptioneller Entwurf

Die kanonische Datenstruktur stellt den konzeptionellen Entwurf auf dem Weg zu einem leistungsfähigen Datenbanksystem dar. Da es sich um eine übersichtliche grafische Methode handelt, eignet sie sich im besonderen Maße als Kommunikationsmittel zwischen Fachabteilung und DV-Abteilung. Die Wahrscheinlichkeit der Entwicklung benutzerkonformer Systeme erhöht sich dadurch um ein Vielfaches. Außerdem wird hierdurch eine Basisschnittstelle geschaffen, die einen iterativen Ausbau des Datenbankeinsatzes ermöglicht, ohne bereits die fachbezogene Entwurfsphase mit systemspezifischen Restriktionen zu belasten. Die einzelnen Schritte des Entwurfsprozesses sind in Abbildung 2 wiedergegeben.

Nachfolgend wird der Entwurfsprozeß in seinen wesentlichen Schritten an einem Beispiel erläutert: Die Bibliothek eines Unternehmens plant ein innerbetriebliches Literaturverzeichnis für Zeitschriften zentral für alle Fachabteilungen mittels DV. Die Zeitschriftenartikel werden von Sachbearbeitern inhaltlich erschlossen und sind dann über Schlagwörter recherchierbar.

Definition der Benutzersichten

Für jede Benutzersicht sind die notwendigen Datenelemente zu definieren. Sie entsprechen im wesentlichen den Datenelementen aus dem Datenelement-Katalog. Da die Anzahl der im Katalog erfaßten Elemente sehr groß werden kann, empfiehlt es sich, gemeinsam und in gleicher Weise genutzte Datenelemente bei der kanonischen Datenstruktur zusammenzufassen und in einer Blase darzustellen.

Anschließend sind die Geforderten Zugriffswege zwischen den Datenelementen festzulegen und durch Pfeile darzustellen (Abbildung 3). Die Zugriffswege ergeben sich aus der Analyse des Verarbeitungsablaufs.

Die kanonische Datenstruktur unterscheidet zwei Beziehungen:

1-Zuordnung: Jeder Ausprägung des Datenelements Zeitschriftenreihe (Abbildung 4) entspricht genau eine Ausprägung bei Verlag, dargestellt durch einen Pfeil. Ist nicht immer eine Ausprägung des zugeordneten Datenelements gewährleistet, so spricht man von einer konditionalen Beziehung und kennzeichnet diese mit einem C.

M-Zuordnung: Einer Ausprägung des Datenelements Zeitschriftenreihe sind (m 0) Ausprägungen des Elements Heftnr zugordnet (Doppelpfeil).

Durch Überlagerung der Pfeile lassen sich alle Beziehungen zwischen zwei Datenelementen abbilden (1 : 1, 1 : n, n: m). Die Abbildungen 4 bis 6 stellen die jeweiligen Benutzersichten dar.

Die Anwendung "Auskunft" stellt Informationen über Zeitschriftentitel, Verlag, Erscheinungsdaten des Einzelheftes sowie Titel, Autor, Kurzfassung und Datum der Artikel bereit. Der Zugriff auf diese Daten soll über die Titel der Zeitschriften und der Artikel wie auch über Schlagwörter erfolgen.

Um alle diese Informationen zur Verfügung zu stellen, werden in einer zweiten Anwendung die Artikel eines Heftes mit Deskriptoren und Kurzfassung von einem Sachbearbeiter erschlossen (Abbildung 5).

Abbildung 6 stellt die Benutzersicht der Ausleihe dar. Hier wird für den Zeitraum der Ausleihe dem einzelnen Heft einer Zeitschrift eine Person zugeordnet.

Komposition der Benutzersichten

Dieser Schritt besteht lediglich in einer zeitweisen Überlagerung der einzelnen Benutzersichten. Dadurch entsteht die in Abbildung 7 dargestellte erste gemeinsame kanonische Datenstruktur.

Eine wesentliche Voraussetzung für die spätere Optimierung kann hier bereits durch die Vermeidung von Synonymen beziehungsweise Homonymen geschaffen werden. Beispiele für synonyme Begriffe sind hier die in den Abbildungen 4 und 5 vorkommenden Datenelemente Schlagwort und Deskriptor, die unter Schlagwort weitergeführt werden, sowie die Elemente Deskribierer und Ausleiher, hinter denen jeweils nur die Pesonalnummer zu sehen ist.

Optimierung der Gesamtstruktur

Die Optimierung der bisher verarbeiten Struktur bildet den Schwerpunkt des Entwurfsprozesses. Dazu gehört das Erreichen der vollen funktionalen Abhängigkeit, wobei man Elemente jeweils nur den für die Identifizierung ausreichenden Schlüsselelementen zuordnet, und die Beseitigung der transitiven Abhängigkeiten. Dieser Vorgang entspricht dem Prozeß der Normalisierung im Relationenmodell, der sich durch die grafische Darstellungsform erheblich vereinfacht.

Weiterhin müssen bei der Optimierung die n : m-Beziehungen beseitigt werden, da sich in Datenbanken diese Art der Verknüpfung nicht direkt abbilden läßt. Eine n : m-Beziehung wird in zwei 1 : n-Zuordnungen aufgelöst, wobei aus den beiden Datenelementen, die in Beziehung zueinander stehen, ein zusätzliches, zusammengesetztes Datenelement gebildet wird.

Diesen Vorgang verdeutlichen an der n: m-Beziehung zwischen Artikelnummer und Schlagwort die Abbildung 7 und 8.

Bereits bei der Erstellung einzelner Benutzersichten und später bei der Komposition der Gesamtstruktur können redundante Beziehungen auftreten. In Abbildung 7 ist dies zwischen den Datenelementen Artikel- nur, Heftnr und Datum der Fall. Damit keine Informationswege verlorengehen, ist sicherzustellen, daß nur solche Zugriffswege eliminiert werden, die durch andere Wege in gleicher Bedeutung abgedeckt werden.

Die Anwendung der ausschnittweise aufgeführten Regeln überführt die unbereinigte kanonische Datenstruktur der Abbildung 7 in die optimierte Darstellung von Abbildung 8.

Komprimierung der Gesamtstruktur

Die Komprimierung der Struktur wird durch die Bildung von kanonischen Satztypen erreicht. Ein Satztyp besteht aus einem Primärschlüssel und seinen Attributen. Alle Datenelemente, von denen mindestens ein einfacher Pfeil abgeht, sind Primärschlüssel. In Abbildung 8 erfüllen die dargestellten Datenelemente diese Forderung. Alle Datenelemente, von denen keine einfachen Pfeile abgehen, verkörpern Attribute; sie lassen sich durch diejenigen Primärschlüssel identifizieren, die mit einfachen Pfeilen auf sie verweisen (Verlag, Datum, Titel in Abbildung 8).

Gehen von einem Attribut Doppelpfeile ab, so stellt das Attribut einen Sekundärschlüssel dar (Titel in Abbildung 8).

Die doppelte Beziehung von Heft zu Person ("Wird ausgeliehen von" und "wird deskribiert von") wurde dadurch aufgelöst, daß in den Segmenttyp Heft die Personalnummer des Ausleihers und die des Deskribierers eingegangen sind. Abbildung 9 zeigt den Aufbau der kanonischen Satztypen für das verwendete Beispiel.

Systemspezifischer Entwurf

Die kanonische Datenstruktur in ihrer auf Satztypen komprimierten Form ermöglicht einen einfachen Übergang sowohl zu hierarchischen und netzorientierten DB-Systemen, aber auch zu Systemen, die ein relationales Konzept unterstützen.

Als Beispiel sei die Überleitung in die hierarchische Struktur des IMS herausgegriffen. Der Entwurf beginnt mit der Bestimmung der Root-(Wurzel-)Segmente. Als Root-Segmente wählt man alle Satztypen, zu denen keine anderen Satztypen mit doppelten Pfeilen verweisen. Je Root-Segment entsteht eine IMS-Datenbank. Der Zugriff auf die Datenbanken ist nur über diese Root-Segmente oder über Sekundär-Indizes möglich. Die Sekundär-Indizes werden direkt aus der kanonischen Datenstruktur übernommen.

Als Ergebnis dieser Transformation entsteht das in Abbildung 10 dargestellte IMS-Design.

Physischer Entwurf

Ausgehend von dem systemspezifisch logischen Entwurf der vorangegangenen Phase ist die physische Struktur festzulegen.

Hierbei sind zwei Gesichtspunkte zu berücksichtigen:

- Möglichkeiten, die das DBMS zur physischen Gestaltung anbietet;

- Anforderungen an die physische Struktur, die sich aus der datenspezifischen Anwendungsanalyse ergeben.

Performance-Erwägungen stehen dabei im Mittelpunkt. Unter anderem werden dabei

- Zugriffspfade genauer spezifiziert (Umfang der Verkettung);

- Plazierung der Satztypen zueinander geplant (Wahl der Speicherungsform, Definition von Datasets);

- Positionen für Systemdaten (Indizes) festgelegt

- Schlüsselformate und Hash-Routinen abgestimmt.

Der entscheidend Vorteil der hier dargelegten Methode besteht darin, daß der Datenbank-Designer sich eines strukturierten Verfahrens bedient. Damit werden Fehler zwar nicht ausgeschlossen, doch wird der Entwurfsprozeß transparent und nachvollziehbar gemacht, da er nach jeder Phase klar definierte, reproduzierbare Ergebnisse liefert. Die Fehlerwahrscheinlichkeit wird dadurch um ein Vielfaches verringert.

Außerdem gewinnt man mit der Erstellung eines konzeptionellen Entwurfs eine entscheidende Basis, um auf zukünftige Forderungen der Anwenderseite flexibel reagieren zu können. Die Auswirkungen auf die Gesamtstruktur können frühzeitig erkannt und berücksichtigt werden.

*Hartmut Skubch ist Mitarbeiter beim EDV Studio Ploenzke, Wiesbaden