Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

02.07.1993

Jede RAID-Kategorie passt zu einer bestimmten DV-Umgebung

RAID-Level 5 muss besser sein wie RAID-Level 1 - das erkennt der Laie bereits am Preis. Mit diesem folgenschweren Missverstaendnis beginnt allzuoft die Anschaffung eines neuen RAID-Massenspeichers. Das Maximum erreicht der Aerger spaetestens dann, wenn die unternehmenseigene Revisionsabteilung bemaekelt, dass die eingekaufte Datensicherheit erheblich teurer als eine konventionelle grosse Festplatte ist. Vermeiden laesst sich dies mit einem Blick auf die technischen Grundlagen der RAID- Massenspeicher.

CW-Bericht, Walter Mehl

Im Englischen bezeichnet "raid" einen Angriff oder Ueberfall, eine Razzia, aber auch ein Himmelfahrtskommando. In der Informatik steht die Abkuerzung eher fuer das Gegenteil: Die RAID-Technik (Redundant array of independent disks, oft

auch: . . . of inexpensive disks) beschleunigt Schreib- und Lesevorgaenge auf Festplatten und soll vor Datenverlust schuetzen.

Ein RAID-Speichersystem besteht aus zwei oder mehr Festplatten, die dem Anwender als eine Einheit erscheinen. Das System kann die gespeicherten Daten nach einem Festplattenausfall (Head crash) selbstaendig rekonstruieren, meistens ohne Eingriff von aussen und ohne Unterbrechung der laufenden Programme. Wie aber funktioniert der Rennwagen, dessen Reifen sich nach einem Platten von selbst flicken?

Die Erfinder der RAID-Definition suchten einen Weg, Daten redundant und damit fehlertolerant auf mehreren Festplatten zu speichern. Der Wunsch nach Datensicherheit kollidiert aber unter Umstaenden mit dem nach moeglichst hoher Verarbeitungsgeschwindigkeit. Optimale Ergebnisse erhaelt nur, wer die fuer seine Anwendung richtige RAID-Kategorie waehlt.

Wenn in einem Unternehmen der Wert der Daten hoeher ist als der Hardwarepreis, dann koennte sich die Anschaffung eines RAID- Massenspeichers lohnen. Nur gilt eben nicht von vornherein, dass die RAID-Kategorie 5 in jeder Situation die beste Wahl ist. Jede der Kategorien von 0 bis 5 wurde fuer eine bestimmte DV-Landschaft entworfen und passt sich dort am besten ein.

RAID-Kategorie 0

(Disk striping)

Die Grundlagen des RAID-Levels 0 lassen sich am Beispiel einer Bibliothek zeigen, die vor Widrigkeiten wie Feuer oder Diebstahl geschuetzt werden muss. Relativ sicher sind die wertvollen Buecher nur, wenn sie ueber mehrere Gebaeude verteilt sind. Gleichzeitig wird es aber schwieriger, die Bibliothek zu nutzen, weil die noetigen Werke nicht an einem Ort sind.

In der RAID-Kategorie 0 verteilt das System die eingehenden Dateisegmente in der Reihenfolge ihrer Ankunft auf die Festplatten, so dass die Schreibgeschwindigkeit relativ hoch ist. Eine Datei aus zwanzig Segmenten, die auf fuenf Festplatten untergebracht werden soll, entspricht im Bibliotheksbeispiel einem zwanzigbaendigen Lexikon und fuenf Gebaeuden. Nach der RAID- Definition 0 wird der erste Band des Lexikons im Gebaeude mit der Nummer eins angeliefert, Band zwei im Gebaeude zwei und so fort bis zum Band sechs, der wieder im ersten Gebaeude landet (vgl. Abbildung).

Mit dieser Methode ist eine Datei allerdings nicht besonders geschuetzt: Faellt eine Festplatte aus, gehen alle dort gespeicherten Sektoren verloren, und die Datei ist unbrauchbar.

Einziger Vorteil dieser Verteilung ist die Verarbeitungsgeschwindigkeit, die im Beispiel mit fuenf Festplatten theoretisch etwa fuenfmal so hoch wie bei einer einzigen grossen Festplatte ist. Tatsaechlich speichern RAID-0-Systeme Informationen ungefaehr doppelt so schnell wie Festplatten mit vergleichbarer Kapazitaet; beim Lesen sind die Unterschiede noch geringer.

Die RAID-0-Definition fuehrt den Namen Redundant array of independent disks eigentlich zu unrecht, weil keine redundanten Daten gespeichert werden, aus denen sich zerstoerte Informationen rekonstruieren lassen. Fehlertolerant wird diese Art der Datenspeicherung erst, wenn man sie zum Beispiel um die Anforderungen der RAID-1-Definition erweitert.

RAID-Kategorie 1

(Disk mirroring, disk shadowing)

Auch die RAID-Definition 1 laesst sich am Beispiel der Bibliothek erlaeutern: Man baut jedes Gebaeude doppelt und stellt in beide Bibliotheken die gleichen Buecher.

Die Redundanz ist im RAID-Level 1 offensichtlich: Jede Information ist doppelt auf den Festplatten gespeichert - zum Lesen ist aber nur die Information auf einer Festplatte noetig.

Technisch erfordert ein RAID-1-Speichersystem nur geringen Aufwand, trotzdem liegen aber die Kosten pro MB Kapazitaet doppelt so hoch wie bei einer einfachen Festplatte. Die zweifache Datenhaltung verlaengert ausserdem die Datenspeicherung etwas - allerdings laeuft die Suche nach einem Dateisegment schneller ab, weil gleichzeitig auf beiden Festplatten gesucht werden kann.

RAID-Kategorie 2

RAID-Level 2 entzieht sich der Erlaeuterung anhand des Bibliotheksbeispiels und wird meist nur in der Grossrechner-Welt eingesetzt. Grossrechner ermitteln staendig Pruefsummen sowie weitere redundante Informationen fuer die zu speichernden Daten und rekonstruieren bei einem Ausfall des Massenspeichers die Daten aus diesen Zusatzinformationen. Diese Zusatzdaten werden zur Sicherheit auf speziellen Festplatten gespeichert, so dass sich folgender Aufbau ergibt: Von einer Datei wird das erste Bit auf der ersten Festplatte gespeichert, das zweite auf der zweiten und so weiter. Parallel dazu fixiert der Rechner die Pruefsumme oder die Informationen fuer die Dateirekonstruktion auf zusaetzlichen Platten.

Der Speicherbedarf eines RAID-2-Systems ist also kleiner als bei der RAID-1-Variante, allerdings eignet sich das Verfahren nur bei Rechnern, die automatisch die redundanten Zusatzinformationen berechnen.

RAID-Kategorie 3

Eigentlich stellt RAID-Level 3 eine Variante der RAID-Definition 2 fuer PCs dar. Auf zwei oder mehr Festplatten werden die Daten abgelegt und auf einer weiteren Platte die Zusatzinformationen. Eine Datei kann Bit fuer Bit gespeichert werden, oft bieten die Systemhersteller auch eine Einteilung in Bytes oder einer anderen Groesse an.

Mit der Uebernahme dieser Struktur aus der RAID-Definition 2 bleibt allerdings auch ein Nachteil bestehen: Weil eine Datei in winzige Splitter aufgeteilt und ueber alle Laufwerke verteilt wird, muessen die Informationen auch nach und nach von allen Festplatten gelesen werden. Damit blockiert aber ein Lesevorgang alle Festplatten, so dass die Steuerung des Speichersystems nie mehrere Lesebefehle parallel abarbeiten kann. Der Zugriff auf die gespeicherten Daten dauert also bestenfalls so lange wie bei einer einzigen konventionellen Festplatte - eine Beschleunigung ist nach der RAID-Kategorie 3 nicht moeglich.

Ideal ergaenzen sich RAID-3-Systeme und Workstations fuer die Bildbearbeitung, weil dort nur einzelne grosse Grafikdateien gehandhabt werden muessen und die Zahl der Lesebefehle klein ist. Voellig falsch am Platz waeren diese Systeme bei einer Anwendung, die haeufig auf viele kleine Dateien zugreifen muRAID-Kategorie 4

Die RAID-Kategorie 4 umgeht das schwerwiegendste Problem, das beim RAID-Level 3 bestand: Ein Lesevorgang muss nach dem anderen abgearbeitet werden - eine Parallelverarbeitung ist nicht moeglich, weil eine Datei in winzige Bestandteile aufgeteilt und ueber mehrere Festplatten verteilt wird.

Bei der RAID-Definition 4 wird eine Datei in Abschnitte gegliedert und diese nacheinander auf die Festplatten verteilt, wobei ein Abschnitt so gross ist wie ein Block bei der Datenuebertragung zwischen Rechner und Festplattensystem. Bei einem Speichersystem mit fuenf Festplatten ergibt sich beim Lesen folgende Situation: Pro Zeiteinheit sucht, liest und uebertraegt das System fuenfmal mehr Daten als eine einzelne Festplatte. Beim Schreiben allerdings bieten sich gegenueber dem RAID-Level 3 keine Vorteile. Theoretisch koennten auch fuenf Dateisegmente gleichzeitig gespeichert werden. Weil aber nach jedem Segment zuerst die Information fuer die Fehlerkorrektur auf der dafuer bestimmten Festplatte abgelegt werden muss, kann ein RAID-4-System nur einen Schreibvorgang nach dem anderen abarbeiten.

RAID-Kategorie 5

In den RAID-Definitionen 1 bis 4 wird auf einer bestimmten Festplatte die Information fuer die Fehlerkorrektur gespeichert. Sollen Informationen auf den Festplatten des RAID-Systems fixiert werden, dann muss parallel zu jedem Schreibvorgang diese Zusatzinformation veraendert werden. Dieser Ablauf macht es unmoeglich, mehrere Schreibvorgaenge parallel erfolgen zu lassen.

In der RAID-5-Definition enthaelt jede Platte im System Daten und Pruefsummen, es gibt fuer letztere also keine spezielle Festplatte. Wie im RAID-Level 4 schickt die Systemsteuerung einen Block aus der Datenuebertragung zu einer Festplatte. Die Pruefsumme wird gleichzeitig auf einer anderen Festplatte gespeichert. Faellt eine Platte aus, lassen sich die Daten und die Pruefsumme von den Informationen auf den anderen Festplatten rekonstruieren (vgl. Abbildung).

Anders als bei einer einzelnen grossen Festplatte koennen somit auf einem System mit vier Platten vier Lesevorgaenge, aber nur zwei Schreibvorgaenge gleichzeitig bearbeitet werden. Die Zahl der parallel ablaufenden Schreibvorgaenge ist immer maximal halb so hoch wie die Zahl der Festplatten im System, weil pro Schreibvorgang eine Festplatte aktiviert wird, um das Dateisegment zu speichern, und eine zweite fuer die Fehlerkorrekturdaten. Im Durchschnitt liegt die Zahl der parallel ausfuehrbaren Operationen also immer bei der halben Anzahl der eingebauten Festplatten. Nur wenn die Zahl der Lesevorgaenge im Vergleich zu den Schreibzugriffen steigt, waechst die Leistung linear zur Zahl der Festplatten im Speichersystem.

Beim RAID-5-Massenspeicher nimmt also die Leistung zu, wenn zusaetzliche Festplatten eingebaut werden - zwar nicht linear, aber doch spuerbar.

Ein RAID-5-System arbeitet optimal unter einem Multitasking- Programm wie Netware, weil es mehrere Ein- oder Ausgabebefehle gleichzeitig abarbeiten kann. Viele Computerhersteller bieten deshalb zu ihren Netware-Servern RAID-5-Speichersysteme.

RAID-Kategorie 6

Bis jetzt ist RAID-Level 6 noch nicht endgueltig festgelegt, doch bieten einzelne Hersteller schon Systeme mit diesem Praedikat an. Ihre Massenspeicher arbeiten aehnlich wie ein RAID-5-System, allerdings speichern sie die Pruefsumme auf zwei verschiedenen Festplatten. Die hohe Redundanz macht den Massenspeicher teurer, aber auch weniger anfaellig gegen Ausfaelle.

RAID-Kategorie 10

Diese Mischdefinition kombiniert RAID-Level 0 und 1. Sie heisst manchmal auch Level 1/0 oder einfach RAID-Level 0 mit gespiegelten Platten.