Archivieren auf optischen Speichermedien

27.05.1999

MAINHAUSEN: Der universelle Ansatz verspricht, daß UDF für alle verfügbaren optischen Speichermedien geeignet ist. Da das Angebot speziell für die Worm-Technologie bisher mehr als unbefriedigend war, stellt sich die Frage, ob UDF diese Lücke schließen kann. Ein Beitrag von Christian Friedrichs*.Neben der sehr komplexen Aufgabe, den vielfältigen Anforderungen an moderne digitale Archive gerecht zu werden, haben die Hersteller die Qual der Wahl, welche Speichersysteme sie unterstützen und in welcher Art. Der Anforderung, digitalisierte Daten mehr als 30 Jahre sicher verfügbar zu halten, steht der stetige technologische Wandel gegenüber. Wer will schon vorhersagen, wie unsere IT-Welt in 30 Jahren aussieht? Käufer von digitalen Archiven sollten also davon ausgehen, daß die Archive im Laufe der Zeit auf neuere Technologien migriert werden müssen und daß die dafür notwendigen Voraussetzungen geschaffen sind. In diesem Artikel soll verständlich erläutert werden, worauf in bezug auf das Filesystem bei der Auswahl eines digitalen Archivs geachtet werden sollte. Dabei sind jedoch einige spezielle technische Informationen notwendig.

Ein langfristiges Engagement

Derzeit stehen für die digitale Archivierung die CD-R und die MO/Worm-Technologie zur Verfügung. Diese scheinbar identischen Technologien sind bei genauerer Betrachtung sehr unterschiedlich. So wird zum Beispiel neben dem unterschiedlichen physikalischen Verfahren auf der CD-R sequentiell aufgezeichnet, also einer festen Spur folgend, wogegen die MO/Worm wahlfreien Schreibzugriff erlaubt und so wie eine Festplatte beschrieben werden kann. Die kleinste zu beschreibende atomare Einheit ist ebenfalls sehr unterschiedlich. Diese ist bei der CD-R in Abhängigkeit von Laufwerk und Schreibsoftware zwischen 64 KB und 1 MB groß. Bei der MO/Worm hingegen wird dieser Wert von der Größe der Sektoren vorgegeben, die zur Zeit zwischen 512 Byte und 2 KB liegen. Moderne Filesysteme können diese positiven Eigenschaften der MO/ Worm-Technologie nutzen, um die Gefahr von Inkonsistenzen zu vermeiden. Weiter fehlt der CD-R das Defekt-Management, das so von der Software übernommen werden muß. Bei der MO-Technologie wird dies von Medium und Laufwerk gehandhabt. Einen weiteren Vorteil kann die MO-Technologie verbuchen, da sich die Laufwerke dem Betriebssystem wie Festplatten präsentieren und gleichermaßen lesend wie schreibend eingesetzt werden können. Für CD-R-Laufwerke hingegen werden spezielle Treiber benötigt. Das Schreiben auf Worm-Medien kann deshalb sehr viel einfacher über einen Filesystemtreiber realisiert werden und ist damit transparent für den Anwender. Die auf dem Markt befindlichen Schreibtreiber für CD-R hingegen sind in Ermangelung von Standards individuell so organisiert, wie sie der jeweilige Hersteller entwickelt hat.

Vorteile durch Filesysteme erschliessen

Ein Problem, das sich bei der digitalen Langzeitarchivierung stellt, ist der sich sehr schnell vollziehende technologische Wandel. In kurzen Zeitabständen vergrößern sich die Speicherkapazitäten verfügbarer Medien, CPUs und Laufwerke stellen deutlich bessere Leistungswerte zur Verfügung.

Der praktische Nutzen von Standards ist unumstritten. Dennoch können Standards den technologischen Entwicklungen nur Rechnung tragen, wenn sie weiterentwickelt werden. Der ISO Standard 9660 für CD-Medien wird heute mit Level 3 geschrieben, kann damit jedoch schon nicht mehr unter DOS oder Windows 3.x gelesen werden, da man dort nur Level 1 kennt. Von UDF gibt es derzeit die dritte Version, die meisten Implementierungen basieren jedoch noch auf der Version 1.5, was in

puncto Austauschbarkeit zu Problemen führen kann.

Ein weiterer Nachteil von weltweiten Standards ist, daß diese sehr lange brauchen, bis sie verabschiedet sind. Dazu kommt, daß universelle Filesysteme sehr viel "Ballast" mit sich herumtragen müssen, der nicht für alle Anwendungen benötigt wird.

Filesysteme, die speziell für die Worm-Technologie entwickelt werden, können modernen Technologien deutlich besser Rechnung tragen und auf die jeweilige Anforderung optimiert werden. Dazu kommt, daß sie durch die spezielle Aufgabe, die sie zu erfüllen haben, sehr "schlank" gestaltet und robust sein können und dadurch in der Lage sind, flexibel auf technische Veränderungen zu reagieren. Dabei sind allerdings Voraussetzungen zu erfüllen, die es möglich machen, neuere Entwicklungen gegen bestehende auszutauschen, ohne dabei für den Anwender eine Einschränkung darzustellen.

Zeit ist Geld, auch bei der Archivierung

Die Anforderungen an digitale Langzeitarchive unterscheiden sich signifikant von Anforderungen, die an eine möglichst uneingeschränkte Austauschbarkeit von Daten gestellt werden. Bei digitalen Archiven steht ohne Zweifel der Sicherheitsaspekt ganz oben auf der Anforderungsliste, aber auch eine Vielzahl weiterer Wünschen sollte realisiert werden. So kann es von großem Vorteil sein, wenn Filesysteme für digitale Archive die Möglichkeiten ausnutzen können, die jeweils durch den Stand der Technik gegeben sind. Die bei Worm-Laufwerken technisch möglichen Schreibgeschwindigkeiten können von den herkömmlichen ECMA-167-basierenden Filesystemen, wie zum Beispiel UDF, nur teilweise genutzt werden. Aktuelle Entwicklungen eines log-structured Filesystems der Universität Berkeley gehen von einem ganz anderen Ansatz aus und werden dadurch in der Lage sein, bis nahezu 100 Prozent der Schreibperformance auszuschöpfen. Diese Technologie wäre für den Einsatz auf Worm-Medien auch sehr geeignet und würde in Sachen Sicherheit und Performance eine deutliche Verbesserung darstellen.

Ausfälle können teuer werden

In puncto Datensicherheit ist es wichtig, daß eine Unmittelbarkeit beim Schreiben möglich ist. Sobald eine Datei geschlossen wurde, sollten alle Daten auf dem Medium sicher geschrieben sein. Fehler beim Schreiben sollten synchron gemeldet werden. Diese Voraussetzung ist sehr wichtig, um Datenverlusten vorzubeugen. Ein gutes Filesystem muß in der Lage sein, diese Anforderung bei akzeptabler Geschwindigkeit zu realisieren. Es müssen Desaster Recovery Tools vorhanden sein, die ein schnelles Recovery ermöglichen, wenn das Medium zum Beispiel durch Systemabstürze in einen inkonsistenten Zustand gekommen ist.

Aus diesem Grunde ist File- oder Volumespanning für digitale Archive eine ungeeignete Lösung. Neben den Einschränkungen der sogenannten

"User Mobility" ist das Risiko inkonsistenter Filesysteme sehr groß, wobei die Recovery-Zeiten nicht akzeptabel sind, wenn das Filesystem auf dem Standard ECMA 167 basiert. Die Verfügbarkeit der digitalen Archive kann in diesem Fall über mehrere Stunden unterbrochen sein.

Wichtig ist auch, daß inkrementelle Änderungen des Filesystems über einen Filesystemtreiber möglich sind, denn obwohl sich die Daten auf einem Worm-Medium physikalisch nicht mehr löschen lassen, sollte das logische Löschen, Verändern oder Umbenennen von Daten und Verzeichnissen erlaubt und der wahlfreie Zugriff auf alle Daten möglich sein. Dabei ist es wichtig, daß eine Versionierung der Dateien den Zugriff auf alle Versionen ermöglicht.

Wenn man einen solchen Filesystemtreiber benutzen will, um UDF auf Worm anzuwenden, ist zu erwarten, daß Schreib- und Lesegeschwindig-keit sehr langsam sind. Das liegt daran , daß nur zwei Schreibstrategien im UDF-Standard erlaubt werden. Für eine gute Performance jedoch sind Schreibstrategien (ICB strategy) notwendig, die der ECMA-167-Standard vorsieht, der UDF-Standard jedoch ausschließt. Eine Alternative dazu ist das Verwenden von Mastering-Programmen in der digitalen Archivierung, die jedoch das Medium in einigen wenigen Sessions beschreiben müssen.

Die Nachteile sind ein zeitaufwendiger Aufzeichnungsprozeß, der überwacht werden muß, und daß die Daten über einen längeren Zeitraum gesammelt werden müssen, was zu einem Sicherheitsrisiko werden kann. Der Aufzeichnungsprozeß muß gegebenenfalls neu gestartet werden, wenn es zu Problemen wie Buffer-Underrun oder Systemabstürzen kommt. Die zuvor geschriebenen Sessions müssen dann zeitaufwendig und mühsam wiederhergestellt werden.

Schützen proprietäre Formate meine Daten?

Es ist für den Anwender von Vorteil, wenn eine möglichst große Unabhängigkeit von Applikationen - und damit von Anbietern - vorhanden ist, um die Datenträger mit Standardbrowsern lesen und beschreiben zu können. Dafür ist es wichtig, daß das Betriebssystem standardisierte Schnittstellen zur Verfügung stellt. Diese bilden die Grundlage dafür, daß Filesysteme modular integriert werden können. Viel wichtiger als die Ondisk-Datenstruktur, also die Organisation der Daten auf dem Datenträger, sind in diesem Zusammenhang die Standards für diese Schnittstellen. Solaris, Linux und Windows NT zum Beispiel stellen solche Schnittstellen zur Verfügung.

Von Bedeutung ist heute im Unix-Umfeld die Vnode-Schnittstelle und für die Windows-Welt die IFS-Schnittstelle (Installable Filesystem). Weiter wird es möglich sein, durch das Einhalten dieser Standard-Schnittstellen neuere Entwicklungen parallel zu bestehenden Filesystemen ohne Einschränkung für den Anwender zu ergänzen und einen Betrieb von "alten" neben "neuen" Technologien zu ermöglichen. Sicherheit für den Anwender bringt es natürlich, wenn auch andere Anbieter die Möglichkeit haben, diese nicht standardisierten Filesysteme zu implementieren. Voraussetzung dafür ist, daß über das Filesystem eine Dokumentation vorliegt und SDKs angeboten werden, die diese Arbeiten beschleunigen. Lizenzfrei verfügbare Lesetreiber könnten die Möglichkeit der Anwender erweitern, Daten auszutauschen oder zu verteilen. Dabei werden die Zugriffsrechte nicht eingeschränkt, da diese vom Betriebssystem verwaltet werden.

Nicht nur nach oben zum Benutzer hin sind die Schnittstellen vom Filesystem standardisiert, sondern auch nach unten zu den Gerätetreibern. Hier gibt es für MO/Worm-Geräte keine Einschränkungen, da sie sich wie Festplatten präsentieren. In der Klasse der CD-R-, CD-RW-, DVD-RAM-, DVD-R- und DVD(+)-RW-Laufwerke findet man bis jetzt keine standardisierten Geräteschnittstellen. Deshalb sind Probleme bei der Verwendung von Filesystemtreibern für diese Klasse vorprogrammiert.

Proprietäre Systeme arbeiten meist mit eigenen Filesystemformaten, die nicht die Standard-Schnittstellen des Betriebssystems verwenden und darüber hinaus nur als Gesamtsystem einsetzbar sind. Nachteil ist, daß die Daten nur mit diesen Systemen gelesen werden können und der Anwender darauf angewiesen ist, daß die vom Hersteller angebotenen Systeme über die gesamte Laufzeit des Archivs verfügbar sind. Dabei ist zu bedenken, daß durch das Betriebssystem die Einhaltung der Systemrichtlinien gewährleistet ist, was proprietäre Systeme, die ohne Filesystemtreiber arbeiten, nicht leisten können. Betriebssysteme können somit ganz anders als proprietäre Implementierungen vor nicht autorisierten Zugriffen schützen.

Bei der Austauschbarkeit spielen andererseits Standards eine große Rolle. Man muß auf möglichst vielen Plattformen eine Leseverfügbarkeit gewährleisten. Standards wie das ISO-9660-Format können diese Aufgabe sehr gut erfüllen und haben dazu geführt, daß sich die CD-Technologie innerhalb kürzester Zeit als Austauschmedium etablieren konnte. UDF kann diese Aufgabe für die DVD-Technologie erfüllen, wenn diese eine stärkere Verbreitung gefunden hat, oder im Umkehrschluß bei der Verbreitung dieser Technologie hilfreich sein. UDF auf Worm-Medien wird man in Zukunft allerdings nicht so schnell entdecken, da selbst in der neuen Version von NT, Windows 2000, keine UDF-Leseunterstützung für die Klasse der Worm-Laufwerke geplant ist. Damit wird der Worm-Technologie auf der anderen Seite auch nicht die primäre Aufgabe der Austauschbarkeit zukommen.

Unabhängige Spezialisten sind gefragt

Es läßt sich also feststellen, daß die sequentiell orientierten optischen Medien wie CD oder DVD mit den dafür vorhandenen Filesystemen und Produkten zum Brennen von Medien ihren Schwerpunkt im Massenmarkt haben und weniger für den Einsatz bei der professionellen digitalen Archivierung geeignet sind. Ihr Schwerpunkt ist demnach im Datenaustausch zu sehen. Dabei ist es dann auch von Vorteil, daß die Preise für CD-R-Medien in letzter Zeit sehr günstig wurden. Einen Kostenvergleich müssen MO/Worm Systeme dennoch nicht scheuen.

Berücksichtigt man alle Komponenten, die für digitale Archive benötigt werden, wie Jukeboxen, Medien, Anzahl der Laufwerke, Software zum Betrieb der Systeme sowie die Wartung, wird man feststellen, daß die CD-R-Technologie schon heute im Verhältnis Mark pro GB nicht mehr günstiger ist. Dies wird sich noch einmal deutlich für die MO/Worm-Technologie in eine positive Richtung entwickeln, wenn die nächste Speicherkapazität mit 9,6 GB pro Medium umgesetzt wird. Dabei ist der höhere administrative Aufwand, den man CD-R-Systemen einmal unterstellen kann, noch nicht berücksichtigt.

Für Christian Friedrichs stellt die MO/Worm-Technologie die bessere Alternative dar.

*Der Autor ist Produktmanager bei der GDI Gesellschaft für Digitale Informationstechnik mbH in Mainhausen.

Zur Startseite