Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

24.05.1996 - 

Speichern und Archivieren/

Flexible und schnelle Wege zu den kostbaren Terabytes

Network Attached Storage, NAS, heißt die Zauberformel. Die Speicher können sich bei dieser Systemauslegung geografisch nah am Ort des Geschehens befinden, in passender Ausbaustufe aber doch von jedem Arbeitsplatz aus zugänglich sein. Moderne serielle Übertragungswege für die Rechner-Peripherie-Übertragung und den Datentransport im Netz werden diese Forderungen erfüllen.

Derzeit sind hauptsächlich zwei serielle Übertragungsmedien und -protokolle dafür einsetzbar. Die seriellen Busse Serial Storage Architecture (SSA) und Fibre Channel (FC) haben mit derzeit 20 MB/s beziehungsweise 100 MB/s gute Ausgangspositionen (siehe entsprechende Kästen).

Die parallele Übertragung ist aber noch lange nicht am Ende. Mit Ultra-SCSI kommt man derzeit auf 40 MB/s, bald voraussichtlich sogar bis auf etwa 80 MB/s. Es gibt also durchaus eine weite Überschneidung mit den seriellen Techniken. Dadurch ist ein weicher Übergang zu den schnelleren seriellen Bussen möglich.

Die Datenspeicher, Festplattenlaufwerke für Online- sowie Bandlaufwerke für den Nearline-, Offline- und Datensicherungsbetrieb werden in der Nähe ihrer häufigsten Nutzung ins Netz eingebunden. Eine zentrale Autorität steuert und überwacht den Datenverkehr, die Vergabe der Nutzungsrechte und die Anpassung an geänderte Verhältnisse. Das kann an einer normalen Workstation geschehen, die mit entsprechenden Privilegien ausgestattet ist.

Datenhaltung über mehrere Stufen gegliedert

Diese Aufgaben setzen natürlich eine entsprechende Software voraus. Solche Speicher-Management-Software wurde aus Speicherverwaltungsroutinen und erweiterter Datensicherungssoftware in ein hierarchisches Konzept (Hierarchical Storage Management = HSM) integriert.

Dabei werden die am häufigsten benötigten Daten und Programme so nah wie möglich am verarbeitenden Rechner gehalten. Weniger genutzte Daten und Programme finden sich manchmal über mehrere Stufen gegliedert auf Medien mit größerer Kapazität, aber geringerer Zugriffsgeschwindigkeit. Oft stehen dabei optische Speichermedien in der hierarchischen Rangfolge zwischen Platten und Bändern. Oft ist es aber teuer und überflüssig, diese dann dritte Speichertechnik überhaupt einzusetzen.

Am einfachsten ist der direkte Netzanschluß der Speicherlaufwerke - beim Fibre Channel mit dem gleichen Protokoll und den gleichen physikalischen Übertragungsmedien möglich. Man kommt mit einer universellen Technologie aus.

Große Datenmengen bedingen eine größere Anzahl von Laufwerken. Aus rein statistischen Gründen steigt damit die Fehlerwahrscheinlichkeit. Man nutzt daher bereits seit etwa zehn Jahren die Raid-Verfahren (Redundant Array of Independent Disks), das es als Rait (das "T" steht für Tape) inzwischen auch für Bänder gibt. Eine Server-Anwendung, die mehr als drei Plattenlaufwerke benötigt, wird praktisch immer als Raid genutzt.

Die kommerziellen Namen lassen das oft nicht auf Anhieb erkennen. Begriffe wie "Mirroring", "Symmetric Storage" deuten häufig auf eines der sechs Raid-Verfahren hin. (Ein Überblick über die Raid-Levels und ihre Bedeutung findet sich in der COMPUTERWOCHE Nr. 13 vom 29. März 1996, Seite 32.) Dabei wird für die Fehlererkennung meist ein XOR-Verfahren (eXclusive OR) eingesetzt. Laufwerke mit Fibre Channel haben diese Funktion meist in die Hardware eingebaut, um die Abarbeitung erheblich zu beschleunigen.

Moderne Installationen werden aber nicht mehr stur nach irgendwelchen festen Raid-Verfahren vorgenommen. Heute gibt es schon mehrere Techniken, die das passende Raid-Verfahren je nach Nutzung der Daten selbständig und im laufenden Betrieb aussuchen. Dazu kommen dann noch besondere Verfahren zur Beschleunigung vor allem der Schreibvorgänge. Beim Überschreiben von Datenbereichen muß gelesen, geprüft (XOR), gemischt (alte und neue Daten), neu berechnet (XOR) und dann gespeichert werden.

Ein Verfahren mit der Bezeichnung Log Structured Filing (LSF) umgeht diese für jeden Speichervorgang nötige, aufwendige Prozedur. Dabei werden alle zu schreibenden Daten über einen gewissen Zeitraum in einem Zwischenspeicher (Cache) gesammelt und dann in einem Stück, wie eine einzige Datei in einen noch freien Bereich auf der Platte gespeichert.

Man erspart sich dabei den Verwaltungsaufwand für viele kleine Speichervorgänge und auch das Lesen, Überprüfen und Mischen der Daten. Eine mitgespeicherte Tabelle sorgt beim späteren Auslesen dafür, daß die Daten in der richtigen Reihenfolge und Zugehörigkeit an den Anwender zurückfließen.

Die genannten Forderungen beziehungsweise Ziele sind keine Wunschvorstellungen. Es gibt bereits Produkte, die sich für die vorgegebenen Einsatzbedingungen eignen. Am Beispiel des Clariion-Systems von Data General und des Auto-Raid von Hewlett-Packard läßt sich dies zeigen.

Die meisten Clariion-Speichersysteme werden von anderen Firmen, so zum Beispiel von Unisys, unter anderem Namen zusammen mit den eigenen Computersystemen beim Kunden installiert. Die Server- beziehungsweise Raid-Lösungen lassen sich an alle bekannten Rechnersysteme anschließen.

Der Ausbau auf Größen von mehreren Terabytes läßt sich ohne Betriebsunterbrechung realisieren. Alle Teile, natürlich auch die laut Statistik anfälligsten Baumodule Lüfter und Stromversorgung, werden doppelt ausgelegt. Verschiedene Raid-Verfahren sind auch gleichzeitig nutzbar.

Für den professionellen Betrieb viel entscheidender ist die oft vernachlässigte Betriebssoftware. Die Speichersysteme lassen sich unternehmensweit mit Fernsteuerung über Teilnetze hinweg von einem Platz aus verwalten. Der Zustand jedes Teilsystems bis hin zum einzelnen Lüfter oder Plattenlaufwerk kann jederzeit grafisch beobachtet werden. Ein 3D-ähnliches Bild des realen Geräteschranks stellt die Alarm- oder Statusanzeigen dar. Weitere Daten über den Betrieb (Fehlerhäufigkeit, Auslastung etc.) sind in Echtzeit verfügbar. Man sieht, was passiert, und muß nicht erst unverständliche Protokollausdrucke interpretieren.

Nach langer Entwicklungszeit befindet sich inzwischen das Speichersystem Auto-Raid von Hewlett-Packard bei Kunden im Einsatz. Neben den für hochwertige Lösungen üblichen doppelten Auslegung aller Komponenten hat HP besonderen Wert auf die Leistungsfähigkeit im Raid-Betrieb gelegt.

Solang die Kapazität ausreicht, werden die Daten gespiegelt. In dieser Raid-Betriebsart ist kein XOR und kein Prüflesen nötig. Weniger häufig genutzte Daten werden im laufenden Betrieb in kapazitätsschonendes Raid 5 umgelagert, ohne dabei die Daten physikalisch zu bewegen: die Kernaufgabe des Auto-Raid-Verfahrens.

Eine ständig verfügbare Reservekapazität (Hot Spare) wird auf mehrere Plattenlaufwerke verteilt, um die Zugriffszeit zu verkürzen. Das LSF-Verfahren verbessert die Übertragungsleistung. Bei einem Ausfall eines Laufwerks wird mit den verbleibenden Laufwerken automatisch sofort wieder ein Raid-Zustand hergestellt - auch heute noch nicht selbstverständlich.

In einer verteilten Umgebung mit möglicherweise mehreren Subnetzen ist eine zentrale Überwachung und Konsistenzprüfung aller Daten unabdingbar. Das bedeutet mittlerweile aber nicht mehr, daß die Daten und Programme selbst alle an einem zentralen Ort beim verantwortlichen Leiter sein müssen. Die Datenhaltung ist also physikalisch verteilt und logisch (virtuell) zentralisiert, was an die Übertragungsleistung der Netze hohe Anforderungen stellt.

Oft sind die Teilsysteme aus unterschiedlichen Rechnerwelten zusammengesetzt. Die Vielfalt der eingesetzten Rechner- und Speichersysteme sollte nicht an einer komplexen Protokollvielfalt scheitern.

Hier ist wieder der Fibre Channel im Vorteil, der kein eigenes Protokoll benötigt. Die vorhandenen Übertragungsprotokolle wie TCP/IP (Transfer Control Protocol/Internet Protocol) lassen sich weiter nutzen. Damit ist eine solche Installation plattformunabhängig - ein vorrangiges Ziel jeder größeren Installation.

Die ortsungebundene Nutzung der Speicher mit schnellen Übertragungsmedien ohne lokale Duplizierung vermeidet Konsistenzprobleme und erleichtert die Nutzung der vorhandenen Leerkapazitäten ohne Umlagerung. Mit den genannten Betriebsmitteln läßt sich der Speicherbedarf optimal zwischen Online- (direkter Zugriff), Nearline- (zum Beispiel über Bandwechsler oder Libraries) und Offline-Subsystemen (Datensicherung, Archivierung) aufteilen.

Die Raid-Technik bringt erhöhte Datensicherheit bei großem (Spiegelung) bis mäßigem Aufwand. Moderne Verfahren heben die Zeitverluste - vor allem beim Schreiben - ganz oder zum größten Teil wieder auf. Mit der Einführung der Raid-Ready-Laufwerke und -Schränke steht die erforderliche Überwachungs- und Steuerungsarchitektur für die unternehmensweite Verwaltung zur Verfügung.

Die seriellen Bus-Systeme stellen die benötigten Datenraten mit etwas (SSA) oder mit sehr viel Reserve (FC) bereit. Die tatsächlich vorhandenen Datenraten sind eine Frage der Tagesform und weniger eine Frage der Controller und Laufwerke. Die Netze lassen sich nicht so leicht ergänzen oder beschleu- nigen. Deshalb ist hier eine vorausschauende Planung sehr wichtig.

Kurz & bündig

Es ist nicht unbedingt erforderlich, in einer Client-Server-Umgebung Daten und Programme zentral zu speichern, wohl aber, sie von einem Ort aus zu verwalten. Es kann sich - solange übliche Sicherheitsvorkehrungen getroffen sind - empfehlen, bestimmte Daten physikalisch nah an jenen Orten zu halten, wo die Anwender sie häufig benötigen. Voraussetzung sind moderne Techniken, die die Verbindung unterschiedlicher Rechnersysteme mit verschiedenen Speichertechniken bei hohen Transferraten ermöglichen. Der Autor beschreibt grundlegende Standards für eine flexible und ausbaufähige Anlage der Datensicherungsmaßnahmen.

*Hermann Strass, Ottobrunn, ist Berater für neue Technologien, insbesondere für Bus-Architekturen, Massenspeicher und Netzwerke. Er ist in mehreren nationalen und internationalen Normungsgeremien tätig sowie Autor von Büchern über den SCSI-Bus, Massenspeicher, PCMCIA (PC Memory Card Manufacturers International Associates) und CD-ROM.