Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

09.09.1977

Platzsparende und zukunftssichere Dateikonzipierung:Datenkompression und" virtuelle Datensätze"

MÜNCHEN (uk) - Jeder, der mit der Entwicklung von EDV-Projekten und -Programmen befaßt ist, macht bald die Erfahrung, daß alle Lösungskonzepte durch Hardware-Parameter eingeengt werden. Besonders schmerzvoll ist die Tatsache, daß die zur Verfügung stehenden Speicherkapazitäten begrenzt sind. Auf der Hauptspeicherseite sind diese Schwierigkeiten durch VS-Systeme wesentlich verringert worden. Dagegen steht im Bereich der externen Datenspeicher ein solcher allgemeiner Lösungsweg bisher nicht zur Verfügung

Speicherplatz ist rar und teuer, vor allem bei Direktzugriff. Gezwungenermaßen versucht man, sich bei der Konstruktion von Dateien und Datensätzen auf das "Wesentliche" zu beschränken. Die dabei aufgestellten Wahrscheinlichkeitsrechnungen über den zukünftigen Informationsbedarf werden, oft sehr bald, durch Änderungswünsche des Benutzers, Gesetzes-Änderungen und so weiter durchkreuzt. Gelegentlich wird das Mittel "Datenkompression" zur Verringerung solcher Probleme genutzt. Da gibt es dann eine Reihe von Möglichkeiten: zum Beispiel die Speicherung von (positiven) numerischen Daten ohne Vorzeichen; die Umwandlung von dezimal-numerischen Daten in binäre oder die Verwendung von Bitschaltern, die das Vorhandensein von Datenfeldern anzeigen; oder das Entfernen nicht benutzter Datenfeld- und Satzteile. In der Regel sind diese Lösungen mit einem hohen Aufwand verbunden - vor allem deshalb, weil keine entsprechende Standard-Software vorhanden ist - und in vielen Fällen bedeuten sie die Festschreibung des IST-Zustands.

Kompression befreit von" Byte-Knauserei"

Ein universales Kompressionsverfahren aber würde von der "Bytes-Knauserei" und der konzeptionellen Beschränkung durch zu geringe Speicherkapazitäten befreien. Voraussetzung dafür ist, daß ein solches System allgemein anwendbar und unabhängig von speziellen Problemlösungen ist; außerdem muß es unabhängig von der Ein-/Ausgabe-Konzeption und -Konfiguration des Anwenders sein. Im besonderen gilt aber, daß ein solches Verfahren sehr flexibel sein muß und die Änderung von Satzaufbauten nicht erschwert, sondern erleichtert. Diese Forderung zeigt, daß die Umwandlung von Datenfeldern in andere Formate oder jede andere feldbezogene Technik wenig sinnvoll ist. Erfolgreicher ist ein Kompressions-Verfahren, bei dem alle nicht signifikanten Datenteile eines Satzes( das sind Nullwerte, Blanks etc.) nahezu ersatzlos entfernt werden. Selbstverständlich darf ein solches Ergebnis nicht durch einen hohen Hauptspeicherbedarf oder durch eine unverhältnismäßig höhere CPU-Belastung erkauft werden.

"Virtuelle Datensätze" als Nebenprodukt

Vergleicht man einen solchermaßen komprimierten Datensatz mit seinem Original, so fällt ein "Nebeneffekt" ins Auge, der den Effekt der Speicherplatzersparnis unter Umständen an Gewicht übertrifft: Die Länge des physischen (komprimierten) Datensatzes hat nichts mehr mit der Länge des logischen Satzes im Programm gemein, sie ist nur noch von der Menge der tatsächlich zu speichernden

Informationen abhängig. Man kann also von einem realen (weil Speicherplatz belegenden) komprimierten Datensatz reden und von einem virtuellen nur im Programm vorhandenen.

Die Vorteile eines solchen VR-Verfahrens (VR = virtual record) liegen auf der Hand:

- Datensätze können mit einem beliebig großen "Filler" versehen werden denn dieser verschwindet durch die Kompression und belegt keinen Speicherplatz. Dieser "Filler" bildet die notwendige Reserve für die Zukunft.

- Nicht mehr benötigte Datenfelder verschwinden, sofern sie auf "Null" gesetzt werden, ebenfalls. So gibt es keine platzverschlingenden "Leichen" mehr in den Dateien.

- Jedes Datenfeld kann mit großzügigen Reserven definiert werden; der nicht belegte Teil wird, wegkomprimiert". Das gleiche gilt für die Definition von Tabellen.

- Es ist jetzt möglich, Datenfelder für irgendwelche Ausnahmefälle zu beschreiben, die vorher nur "unnötig" Platz belegten und bei nächster Gelegenheit den erforderlichen Sparmaßnahmen zum Opfer fielen. Eine so konzipierte Datei ist für künftige Entwicklungen gewappnet und auch gegen Extrawünsche, Lire- Valuta oder Inflation gefeit.

Das bedeutet vor allen Dingen, daß VR-Dateien langlebiger und - was das Wichtigste ist - billiger sind, denn die Situation, in der eine kostspielige System-Neuentwicklung notwendig wird, weil eine veraltete Datensatz-Struktur den veränderten Anforderungen nicht mehr gewachsen

ist, wird es nur noch selten geben.

R. Schilling ist Mitarbeiter der Alldata Service GmbH.