Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

Disaster Recovery/In weniger als einer Stunde wieder Zugriff auf alle Daten

Rücksicherung unter Produktionsbedingungen

02.05.2003
Ein Schreckensszenario: Eine mittelständische Druckerei mit digitaler Produktion (Computer to Plate = CtP) erlebt wegen eines fehlerhaften Raid-Controllers den GAU.Von Frieder Engstfeld*

Der Raid-Controller des Produktions-Servers gibt den Geist auf, vier Platten sind nicht mehr zugriffsfähig. Ersatzteilbeschaffung, Einbau, ein Komplett-Restore von rund 800 GB Daten dürften gut und gerne vier Tage in Anspruch nehmen, sofern alle Backup-Medien fehlerfrei sind. In dieser Zeit kommen nicht nur alle MAC- oder PC-Workstations nicht an ihre Produktionsdaten heran, auch die CtP-Anlage kann ohne Zugang zum File-Server und den darauf befindlichen Daten nicht angesteuert werden. Produktionsausfall, Zusatzkosten durch ausgelagerte Produktion, Zeitverzögerungen, Schadensersatzforderungen, verlorenes Kundenvertrauen werden teuer.

Die Situation könnte sich aber auch so darstellen: Der Mitarbeiter, der intern auch für die Systemadministration zuständig ist, meldet den Fehler über die Service-Hotline seinem Systemlieferanten. Dort wird per Fernwartung der Fehler analysiert und eine Recovery-Routine angestoßen, die die Daten auf dem Server in weniger als einer Stunde wieder zugänglich macht.

Möglich ist das durch eine ausgeklügelte Sicherheitskonfiguration, die aus handelsüblichen Komponenten besteht: Neben dem klassischen Server mit einem 800-GB-Raid stehen als Backup-Hardware ein 2-TB-NAS-Raid und ein Bandroboter mit 8 TB Online-Kapazität. Gesteuert wird das Ganze durch "eo ipso Aida", eine Speicherverwaltung, die auf Suns SAM-File-System basiert. Diese Software hält während des laufenden Betriebs bis zu vier Kopien des Datenbestandes auf nachgeschalteten Speichersystemen ständig aktuell und übernimmt neben Backup und Archivierung zusätzlich auch HSM-Funktionen (HSM = Hierarchisches Speicher-Management). Aufgrund der Steuerung durch ein erweitertes File-System geschieht all dies für die User im Netzwerk vollkommen transparent.

Diese Konfiguration lässt sich durch ein passendes Recovery-Modul ergänzen, das im Disaster-Fall eine aktuelle Kopie der File-System-Struktur auf einem Notfall-Datenträger mountet, gegebenenfalls die MAC-Ressourcen-Daten restauriert und damit den Zugriff auf die Kopien der Daten ermöglicht. Diese Prozedur dauert bei zirka 450000 Dateien im File-System weniger als eine Stunde. Nach Behebung der Hardwarefehler wird der Da-capo-Prozess auf dem Raid wiederholt und das Gesamtsystem - nach insgesamt nur knapp zwei Stunden Downtime - wieder in den ursprünglichen Zustand versetzt.

Die Kosten für die Speicherlösung (NAS-Device, Bandroboter, Softwarelizenzen) liegen unter 100000 Euro, was Mehrkosten gegenüber klassischen Backup-Lösungen (Bandroboter, Software) von zirka 40000 Euro bedeutet. Michael Hümmer vom Fachverband der Medienberater (FdM) vergleicht sie mit dem Aufwand, den ein Produktionsausfall von mehreren Tagen mit sich bringt: "Die Krux in der grafischen Industrie ist, dass die Produktion in vielen Betrieben fast zu 100 Prozent digital läuft, große Datenmengen das zentrale Nervensystem bilden, auf der anderen Seite aber eine innerbetriebliche IT-Betreuung nur rudimentär vorhanden ist. Das zeigt sich besonders bei Sicherheitsproblemen."

Solche Worst-Case-Szenarien, wie oben beschrieben, stehen zwar nicht allzu häufig auf der Tagesordnung, aber "wir profitieren von dem Produkt bei jeder Migration auf neue Hardware", schildert Gerrit Bremer von eo ipso Consulting & Training in Sittensen. "Wir hängen sie ins System, lassen die Recovery-Routinen laufen, und der Kunde kann nach einer Stunde weiterarbeiten. So gesehen, testen wir die Backup- und Archivsicherheit unserer Installationen mehr oder weniger regelmäßig auf ihre Funktionstüchtigkeit." (kk)

*Frieder Engstfeld ist Direktor des Medialectures Instituts in Bonn.

Abb: Notfallmodul für Druckereien

Bei dieser Sicherheitslösung sorgt der Notfalldatenträger für ein schnelles Recovery. Er enthält Kopien der File-System-Struktur. Quelle: eo ipso