Verwaltung von unstrukturierten Daten

6 Tipps für Storage aus der Open Hybrid Cloud

Regina Böckle durchforstet den Markt nach Themen, die für Systemhäuser und Service Provider relevant sind - oder es werden könnten - und entwickelt dazu passende Event-Formate.
Mit einer Software Defined Storagelösung, die in einer Open-Hybrid-Cloud-Umgebung eingesetzt wird, können Unternehmen unstrukturierte Daten speichern und verwalten. Red Hat definiert sechs Best Practices für die Storage-Implementierung in einer Open Hybrid Cloud.

Das rasante Datenwachstum stellt Unternehmen vielerorts vor beträchtliche Probleme, wobei sich der Anstieg ungleich zwischen strukturierten und unstrukturierten Daten verteilt. Erfahrungen aus mittelständischen und großen Unternehmen zufolge hat sich in den letzten Jahren das Verhältnis zwischen den gespeicherten strukturierten und den unstrukturierten Daten drastisch geändert.

Lange Zeit waren beide Segmente in etwa gleich groß, heute entfallen rund 90 Prozent des Speichervolumens auf semistrukturierte und unstrukturierte Daten, beispielsweise Audio-, Video- und Bilddateien, E-Mails, Office-Dokumente, Zeichnungen und Virtual Machine Images. Genau hier ist vielerorts ein rasantes Wachstum zu verzeichnen.

Die Verlagerung der Daten in eine Open Hybrid Cloud ist eine Möglichkeit, diese Herausforderungen zu bewältigen. Gerald Sternagl, EMEA Business Unit Manager Storage bei Red Hat, empfiehlt, hier folgende Vorgehensweise:

Gerald Sternagl, EMEA Business Unit Manager Storage bei Red Hat
Gerald Sternagl, EMEA Business Unit Manager Storage bei Red Hat
Foto: Red Hat

1. Unstrukturierte Datenbestände inventarisieren

Nur ein geringer Anteil der in einem Unternehmen vorhandenen Daten befindet sich in relationalen Datenbanken. Weitgehend unklar ist, wo die unstrukturierten Informationen wie Bilder, Tabellen, Dokumente, Präsentationen, archivierte Beiträge aus sozialen Medien etc. gespeichert sind. Zu klären ist: Welche Daten liegen vor? Wo befinden sich die Daten? Wem gehören sie? Wann wurden diese zuletzt verwendet?

2. Eine Klassifizierung der Daten vornehmen

Wenn klar ist, welche unstrukturierten Informationen in einem Unternehmen vorliegen, sollte als nächstes ermittelt werden, wer welche Dateien wie oft in welchen Anwendungsszenarien nutzt und welchen Stellenwert die Informationen für ein Unternehmen haben. Bei vorhandenen Beständen kann die Klassifizierung sehr aufwendig sein, weil es kaum automatisch arbeitende Tools gibt, die auch die Dateninhalte gut erkennen und klassifizieren können. Deshalb ist es auch wichtig, den Ursprung der Daten zu ermitteln. Die objektorientierte Datenspeicherung erlaubt die Vergabe von zusätzlichen Attributen, die sich vor allem bei der Implementierung eines Informationslebenszyklus als enorm nützlich erweisen.

3. Gesetzliche Anforderungen für die Aufbewahrung von Daten und Dokumenten berücksichtigen

Wichtig bei Belegen, elektronischen Rechnungen oder anderen Geschäftsdokumenten sind die Aufbewahrungsorte und die Aufbewahrungsfristen. Es gelten die Regeln und Anforderungen an die Speicherung von Daten und Dokumenten aus dem Bundesdatenschutzgesetz. Cloud-Computing-Anwendungsszenarien, bei denen keine personenbezogenen Daten zwecks Aufbewahrung an Server im Ausland gesendet werden, sind datenschutzrechtlich weniger problematisch.
Dokumentenmanagement-Systeme oder Archivierungslösungen können eingesetzt werden, um das Management des Informationslebenszyklus und die Wahl des passenden Speichermediums zu automatisieren.

4. Die Eignung bestimmter Daten für die Open Hybrid Cloud prüfen

Nach Klärung der grundlegenden Bedingungen können Unternehmen eine Entscheidung treffen, welche Daten, etwa aus Compliance-Gründen, weiterhin im Rechenzentrum vor Ort und welche in der Cloud gespeichert werden können.
Die Vorteile einer sicheren Speicherung in der Cloud liegen auf der Hand: Es müssen keine kostspieligen Investitionen in neue Speichersysteme getätigt werden und vor allem entfallen zusätzliche Aufwendungen für den Betrieb und die regelmäßige Datensicherung und Disaster-Recovery-Maßnahmen, da diese üblicherweise in den Cloud-Dienstleistungen enthalten sind.
Cloud-Storage kann aber auch zur Entlastung der lokalen Speicherkapazitäten im Rechenzentrum verwendet werden wie zum Beispiel durch die Auslagerung von Backup- und Disaster-Recovery Images in die Cloud. Die meisten gängigen Enterprise-Backup-Lösungen unterstützen den direkten Datentransfer in die Cloud.

5. Anforderungen wie Verfügbarkeit, Latenzzeiten und Datensicherheit beachten

Die Schaffung der organisatorischen Voraussetzungen im Unternehmen, um zumindest ausgewählte unstrukturierte Datenbestände in eine Open Hybrid Cloud zu migrieren, ist die eine Seite der Medaille. Die andere Seite ist die Klärung und Festlegung zentraler Anforderungen an den Cloud Provider.
Dazu zählen Aspekte wie Verfügbarkeit, Performance und die Latenz der Datenverbindungen. Unternehmen mit vielen Standorten sollten Außenstellen mit einem eigenen lokalen Internetzugang ausstatten, um die Gateways in der Firmenzentrale zu entlasten.

6. Mit einem überschaubaren Pilotprojekt starten

Die Migration unstrukturierter Daten in eine Open Hybrid Cloud ist aus organisatorischer und IT-Sicht ein anspruchsvolles Projekt mit vielfältigen Implikationen. Um erste Erfahrungen zu sammeln, sollten Unternehmen in einem klar umgrenzten Anwendungsszenario ihre Vorstellungen und Anforderungen testen. Auf dieser Basis können dann weitere Datenbestände migriert und die Adaption von Cloud Services weiter vorangetrieben werden.

Zur Startseite