Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

04.05.2006

Hoster setzt auf Platten-Backup

Stefan Müller-Ivok
Das Karlsruher Rechenzentrum des Web-Hosting-Anbieters Schlund + Partner beherbergt 30 000 Server - und somit immense Datenmengen. Der Geschäftserfolg hängt nicht zuletzt von Backup und Verfügbarkeit ab. Die Datensicherung erfolgt neuerdings mittels RAID-Plattensystemen anstelle von Bandbibliotheken.

Von Stefan Müller-Ivok*

Schlund + Partner im Profil

Die Karlsruher Schlund + Partner AG - seit 1999 eine hundertprozentige Tochter der 1&1 Internet AG und technischer Dienstleister der 1&1-Gruppe - betreut rund 2,5 Millionen Internet-Auftritte von 1,9 Millionen Kunden. Mit über fünf Millionen registrierten Domains ist der Anbieter zudem führender Icann-Registrar (Internet Corporation for Assigned Names and Numbers: Organisation zur Koordinierung von Domänennamen, IP-Adressen und Protokollen). Das Rechenzentrum des Hosters beherbergt 30 000 Server, die über eine Speicherkapazität von mehr als 1,6 Petabyte (1600 Terabyte) verfügen. Das Datentransfervolumen pro Monat beträgt über 1000 Terabyte

1995, im Gründungsjahr von Schlund + Partner, dachte noch niemand an Massen-Web-Hosting, und für die noch wenigen Privatnutzer war eine eigene Web-Präsenz eine kostspielige Angelegenheit. Zehn Jahre später hat sich das gründlich geändert. Der Hoster betreut heute als technischer Dienstleister der 1&1-Gruppe rund 2,5 Millionen Internetauftritte von etwa 1,9 Millionen Kunden. Die 30000 Server im Karlsruher Rechenzentrum verfügen über eine Speicherkapazität von mehr als 1,6 Petabyte (1600 Terabyte); das monatliche Transfervolumen beläuft sich auf über 1000 Terabyte - damit gehört es zu den leistungsfähigsten in Europa. Entsprechend hoch sind die Anforderungen an die Administration. "Vor fünf Jahren betrug die durchschnittliche Kapazität eines Server-RAID-Systems 30 Gigabyte, heute sind es rund 500 Gigabyte", macht Systemadministrator Anders Henke die Entwicklung deutlich.

Dieser Anstieg hat natürlich auch gravierende Auswirkungen auf die Sicherung der Kundendaten. Im Backup-Bereich brachte das rasante Datenwachstum ständig neue Anforderungen mit sich, so dass Kapazität und Geschwindigkeit der eingesetzten Bandbibliothek mit AIT2-Laufwerken und 360 Slots bald nicht mehr ausreichten. Auch die zusätzlich eingesetzte Library mit LTO1-Laufwerken und 370 Slots war nach zwei Jahren Betrieb ebenfalls an ihren Grenzen angelangt, da die Datenmenge schneller als erwartet wuchs.

Verschnittproblem mit Bändern

Eine Umrüstung auf LTO2-Laufwerke hätte kurzfristig die Situation verbessert, da auf diese Weise eine Kapazitätsverdoppelung möglich gewesen wäre, doch aus zwei Gründen sah man bei Schlund + Partner davon ab: Erstens hätte der Wechsel rund 75 Prozent des Neupreises einer komplett neuen LTO2-Bibliothek verschlungen und auch nicht das generelle Problem der Bandsicherung gelöst, das den Administratoren zunehmend zu schaffen machte: "Wir konnten ein Band erst dann wieder neu verwenden, wenn die darauf gespeicherten Daten entweder gelöscht oder auf ein anderes Band kopiert worden waren", erklärt Henke. "Dadurch entstand ein hoher Verschnitt in Form brachliegender Kapazitäten. Die Alternative wäre das Umkopieren der Daten gewesen, was zusätzliche Bandressourcen belegt hätte, die bei aktuellen Sicherungsvorgängen nicht zur Verfügung gestanden hätten." Schwierigkeiten gab es auch im Zusammenhang mit der SCSI-Verkabelung der Bandbibliotheken. Nötig waren zum Teil sehr lange und empfindliche Kabel zum Anschluss an die Backup Server, was zu einer großen Fehleranfälligkeit führte.

Wechsel vom Band zur Platte

Vor diesem Hintergrund entschloss sich der Hoster zu einem Technikwechsel. Die Daten im Kundenbereich sollten nicht länger auf Bänder, sondern auf großen redundanten Festplattensystemen auf RAID-Basis gesichert werden. Lediglich zur Archivierung und für interne E-Mail-Konten wurde das Backup auf Band beibehalten. Mit der Umstellung sollte noch ein weiteres Kapazitätsproblem gelöst werden: Bis dahin sicherte eine selbst entwickelte Backup-Software von den Servern auf mehrere Platten im Backup- Server. Ab einer bestimmten Menge an Sicherungsdaten wurden diese von Festplatte auf Bandlaufwerke gesichert. Somit wurden letztlich die gleichen Daten zweimal kopiert, wodurch ein Leistungsverschnitt von 50 Prozent entstand. Es wurde die Überlegung angestellt, das Schreiben auf Band wegzulassen und die Daten nur einmal auf die RAID-Systeme zu sichern.

Verschnitt fällt weg

Auf diese Weise fallen nämlich eine ganze Reihe Beschränkungen weg, die für Bandbibliotheken und Bandmedien typisch sind - so beispielsweise der Verschnittanteil. Eine Platte im RAID-System lässt sich auch "angebrochen" bespielen, ohne dass die Daten zuvor entfernt oder verlegt werden müssen. Zudem können mehrere Server parallel gesichert werden. Restore-Vorgänge hängen nicht mehr davon ab, ob ein anderer Server gerade auf das benötigte Band sichert.

Auch die Kalkulation für Storage-Ausgaben wird flexibler: Statt alle paar Jahre einen hohen Betrag für eine neue Bibliothek auszugeben, die - wenn überhaupt - erst nach längerer Zeit effizient ausgelastet ist, lassen sich RAID-Systeme bei Erweiterungsbedarf gezielt ergänzen.

Anfang 2003 starteten die Karlsruher mit einer Testumgebung in das RAID-Zeitalter. Mehrere hundert dedizierte Server wurden auf zwei 2-Terabyte-Systeme gesichert, die an einen Backup-Server angeschlossen waren und nach den Kriterien Auslastung und Performance begutachtet wurden. Die zugehörige, selbst geschriebene Backup-Software wurde entsprechend angepasst.

Um mehr Storage pro Server verwalten zu können, wurden die Backup-Server mit Dual-Port-FC-Karten, FC-Hubs und FC-Switches erweitert. Hier taten sich jedoch andere Baustellen auf: "Gerade FC-Switches sind pro Port relativ teuer", erklärt Systemadministrator Henke. "Hinzu kommt, dass eine Reihe Ports pro Switch ,still‘ verloren geht. Werden etwa zwei RAID-Systeme über einen FC Switch an einem Server angeschlossen, sind dafür drei Ports nötig. Das Kaskadieren mehrerer Switches, falls einer nicht mehr ausreicht, benötigt ebenfalls Ports, die für die Storage-Systeme dann nicht mehr zur Verfügung stehen." Erschwerend hinzu kam der große Verkabelungsaufwand für die Switches, der auch in speziellen Kabelführungssystemen kaum noch überschaubar war.

Alles in allem werden größere Speicherkapazitäten auf diesem Weg langfristig teuer erkauft. Die nötigen Hardware-Erweiterungen und der Server-Anschluss an die Storage-Systeme kommen letztlich auf einen großen Teil dessen, was der Server selbst kostet. Diese Erfahrung machten auch die Karlsruher und änderten das Konzept für die Speichererweiterung im Backup-Bereich.

JBOD statt Kabelsalat

An dieser Stelle kam der Pfaffenhofener Distributor und Lösungshersteller Esesix mit RAID-Systemen ins Spiel. Neben der großen Kapazität mit 16 Festplatten gab die einfache Erweiterbarkeit durch die JBOD-Technologie (Just a Bunch of Disks) den Ausschlag für den Einsatz dieser Systeme. Im Gegensatz zu RAID-Systemen werden in einer JBOD-Konfiguration die Platten nicht im Verbund, sondern einzeln betrieben und zugewiesen. Anders als bei anderen Systemen, bei denen der RAID-Controller für die JJBOD-Steuerung extra konfiguriert werden muss, übernimmt hier ein eigenes JBOD I/O-Modul diese Aufgabe.

Da somit nur noch ein Controller pro Kaskade verwaltet werden musste, entfielen Aufwand und Kosten für die Installation und den Betrieb zusätzlicher Hardware, die andernfalls zur Verbindung von Server und zusätzlichem RAID-System erforderlich geworden wäre. Ebenso löste sich der Kabelsalat auf: Es genügten ein Kabel vom Server zum RAID-System, eines vom RAID-System zum ersten JBOD, ein weiteres vom ersten zum zweiten JBOD und so weiter. "Ein weiteres Plus: Zum Schutz vor Ausfällen lässt sich bei den Systemen einfach ein zweiter Controller einstecken, und auch die JBODs können redundant verkabelt werden", weist Anders Henke auf nicht unwesentliche Administrationsvorteile hin.

Vom Test zum Ernstfall

Zunächst wurde ein JBOD-System in einer Teststellung evaluiert. Da es mit Controllern von Infortrend ausgestattet war, fanden die System-Administratoren vertrautes Terrain vor. Ein RAID-Controller lässt sich über JBOD-Kaskaden auf sechs bis sieben Gehäuse ausweiten. Pro Jbod wird in der Regel ein RAID 5 mit Spare-Platte konfiguriert. Mit 400 GB-Festplattenkapazität bedeutet das in der Summe 5600 GB Ressourcen pro Gehäuse, im Maximalausbau stehen über 30 TB Storage pro Kaskade zur Verfügung. Insgesamt 20 Server booten ohne interne Festplatten vom Netz. Sie erhalten ihre Konfiguration aus einer zentralen Datenbank und führen das entsprechende Mounting für ihre RAID-Arrays durch. Die Sicherung der jeweiligen Clients startet automatisch. Nach der Sicherung prüft jeder Server, ob er veraltete Daten freigeben kann, und löscht sie beziehungsweise markiert sie als "zu löschen".

Fazit

Die neuen Storage-Systeme haben die Backup-Administration bei Schlund + Partner wesentlich vereinfacht. Das ist insbesondere auf die Zusammenfassung der Platten zu RAID/JBOD-Kaskaden und das zentralisierte Management über wenige Controller (ohne zusätzliche FC Switches) zurückzuführen. "Da wir bewusst auf den Betrieb eines dedizierten Speichernetzwerks mit zentralem Storage-Pool verzichten, müssen mehrere kleinere Speichersysteme mit umso weniger Aufwand installiert und betrieben werden können", fasst Henke zusammen. Das gilt auch bei der Systemerweiterung. Sie gestaltet sich bei der neuen Lösung besonders einfach, so dass zusätzliche RAID/JBOD-Konfigurationen innerhalb von Stunden betriebsbereit sind. Schlund + Partner kann die Storage-Vorräte damit jederzeit und flexibel in der tatsächlich benötigten Größenordnung ergänzen.

*Stefan Müller-Ivok ist freier Journalist in München.