Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

14.03.1975

Formeldarstellung von Dateien zur Speicherplatzeinsparung

Rainer Breitkopf ist Diplom-Physiker und freiberuflich auf dem Gebiet der Speicherplatz-Optimierung tätig Übliche Verfahren der Speicherverdichtung bringen eine Ersparnis von cirka 20 bis 40 Prozent des Speicherplatzes. Im folgenden Wird auf ein Verfahren eingegangen, das bis cirka 99 Prozent Speicherplatzeinsparung ermöglichen kann.

a: EDV-Dateien

Eine häufig benutzte Gruppierung der in der EDV vorkommenden Dateien ist die nach Dateien für

- Programme und Programmroutinen

- Stammdaten

- Bewegungsdaten

- Tabellen.

Diese Gruppierung kennzeichnet auch eine bestimmte Betrachtungsweise. Für die im folgenden geeignete Betrachtung soll eine Datei ganz allgemein als eine endliche geordnete Menge von Punkten verstanden werden.

b: Speicherverdichtung

Betrachtet man eine bestimmte, vorgegebene Datei, so kann man in ihr häufig feststellen, daß nur ein Bruchteil des belegten Platzes zur direkten Datenspeicherung notwendig ist. Neben organisatorischen Maßnahmen wie geschickterer Saztaufbau und bessere Dateistruktur, kann durch geeignetere Zeichencodierung im mittel bis cirka 50 Prozent Platz eingespart werden. Einige Verfahren zur platzsparenden Zeichencodierung sind:

1. 6-Bit-Binärcode (BCD-Code)

Statt 8 Bit pro Zeichen werden nur 6 Bit, bei rein numerischen Dateien nur 4 Bit pro Zeichen benutzt. Eingespart werden maximal 25 Prozent Platz.

2. Mehrfachzeichen

Mehrfach hintereinander auftretende Zeichen werden mit Anzahl und Art des Zeichens angegeben. Dies führt zu variablen Satzlängen. Die Einsparung beträgt cirka 20 Prozent des Platzes.

3. zwei Zeichenlängen

Die alphanumerischen Zeichen treten mit verschiedener Häufigkeit auf. Die häufigsten werden in 4 Bit als Kurzzeichen, die anderen in 6 bzw. 8 Bit als Langzeichen codiert. Je nach Anwendung kann dies zu variablen Satzlängen führen. Die Einsparung beträgt bis circa 40 Prozent des Platzes.

Eine Verknüpfung der Verfahren (zum Beispiel 2. und 3.) kann je nach Anwendung über 50 Prozent Speicherplatzersparnis bringen.

Alle diese Verdichtungsverfahren sind jedoch nur dort möglich, wo die Kapazität eines Zeichens (zum Beispiel 8 Bit für alphanumerische Zeichen; Textdateien) nicht ausgenutzt wird. Bei Programmdateien sind die Zeichen meist voll ausgenutzt und diese Verfahren kaum anwendbar.

c. Speicherverdichtung für Tabellen

Als Tabelle soll hier eine Darstellung von Werten einer Größe mit den Werten der zugehörigen unabhängig Variablen zum Beispiel in Matrixform verstanden werden. Geläufige Beispiele sind: monatlicher Darlehnstilgungsbetrag in Abhängigkeit von Darlehnshöhe und Tilgungsdauer, monatliche Prämienrate einer Lebensversicherung als Funktion der Laufzeit und des Endbetrages, alle in einem Betrieb momentan gültigen Kostenstellen oder die Gemeinkostenumlage pro Kostenart und Kostenstelle.

Für die Darlehnstilgungstabelle ist eine Darstellung als mathematische Formel leicht möglich (siehe Tabelle). Statt der vielen Werte der Matrix-Tabelle sind für die Parameter der Formel nur wenige zu speichern.

d. Speicherverdichtung für Dateien

Entsprechend dem unter a. aufgeführten ist eine Tabelle nur eine spezielle Art einer Datei. Somit läßt sich generell für eine Datei eine Darstellung mittels mathematischer Formel und damit unter Umständen eine wesentliche Speicherplatzeinsparung erhalten.

e. Vorteile der Formeldarstellung

Mittels der Formeldarstellung von Dateien beziehungsweise Dateiinhalten (Tabellen, Programme, Stammdaten) können in speziellen Fällen bis zu 99 Prozent des bisher benötigten Speicherplatzes eingespart werden, das heißt statt zum Beispiel 50 KB wären nur 500 Bytes erforderlich.

f. Nachteile der Formeldarstellung

Nur bei relativ wenigen Dateiinhalten, speziell Tabellen, läßt sich schnell und einfach die zugehörige Formeldarstellung finden. Bei der überwiegenden Zahl von Anwendungen ist die mathematische Analyse zumindest zur Zeit noch schwierig, zeitaufwendig und verlangt hohe Qualifikation. Schon bei kleinen Änderungen ist der gleiche Aufwand wie bei Neuerstellung erforderlich.