Verwaltung von unstrukturierten Daten

6 Tipps für Storage aus der Open Hybrid Cloud

20.06.2014 von Regina Böckle
Mit einer Software Defined Storagelösung, die in einer Open-Hybrid-Cloud-Umgebung eingesetzt wird, können Unternehmen unstrukturierte Daten speichern und verwalten. Red Hat definiert sechs Best Practices für die Storage-Implementierung in einer Open Hybrid Cloud.

Das rasante Datenwachstum stellt Unternehmen vielerorts vor beträchtliche Probleme, wobei sich der Anstieg ungleich zwischen strukturierten und unstrukturierten Daten verteilt. Erfahrungen aus mittelständischen und großen Unternehmen zufolge hat sich in den letzten Jahren das Verhältnis zwischen den gespeicherten strukturierten und den unstrukturierten Daten drastisch geändert.

Lange Zeit waren beide Segmente in etwa gleich groß, heute entfallen rund 90 Prozent des Speichervolumens auf semistrukturierte und unstrukturierte Daten, beispielsweise Audio-, Video- und Bilddateien, E-Mails, Office-Dokumente, Zeichnungen und Virtual Machine Images. Genau hier ist vielerorts ein rasantes Wachstum zu verzeichnen.

Die Verlagerung der Daten in eine Open Hybrid Cloud ist eine Möglichkeit, diese Herausforderungen zu bewältigen. Gerald Sternagl, EMEA Business Unit Manager Storage bei Red Hat, empfiehlt, hier folgende Vorgehensweise:

Gerald Sternagl, EMEA Business Unit Manager Storage bei Red Hat
Foto: Red Hat

1. Unstrukturierte Datenbestände inventarisieren

Nur ein geringer Anteil der in einem Unternehmen vorhandenen Daten befindet sich in relationalen Datenbanken. Weitgehend unklar ist, wo die unstrukturierten Informationen wie Bilder, Tabellen, Dokumente, Präsentationen, archivierte Beiträge aus sozialen Medien etc. gespeichert sind. Zu klären ist: Welche Daten liegen vor? Wo befinden sich die Daten? Wem gehören sie? Wann wurden diese zuletzt verwendet?

2. Eine Klassifizierung der Daten vornehmen

Wenn klar ist, welche unstrukturierten Informationen in einem Unternehmen vorliegen, sollte als nächstes ermittelt werden, wer welche Dateien wie oft in welchen Anwendungsszenarien nutzt und welchen Stellenwert die Informationen für ein Unternehmen haben. Bei vorhandenen Beständen kann die Klassifizierung sehr aufwendig sein, weil es kaum automatisch arbeitende Tools gibt, die auch die Dateninhalte gut erkennen und klassifizieren können. Deshalb ist es auch wichtig, den Ursprung der Daten zu ermitteln. Die objektorientierte Datenspeicherung erlaubt die Vergabe von zusätzlichen Attributen, die sich vor allem bei der Implementierung eines Informationslebenszyklus als enorm nützlich erweisen.

3. Gesetzliche Anforderungen für die Aufbewahrung von Daten und Dokumenten berücksichtigen

Wichtig bei Belegen, elektronischen Rechnungen oder anderen Geschäftsdokumenten sind die Aufbewahrungsorte und die Aufbewahrungsfristen. Es gelten die Regeln und Anforderungen an die Speicherung von Daten und Dokumenten aus dem Bundesdatenschutzgesetz. Cloud-Computing-Anwendungsszenarien, bei denen keine personenbezogenen Daten zwecks Aufbewahrung an Server im Ausland gesendet werden, sind datenschutzrechtlich weniger problematisch.
Dokumentenmanagement-Systeme oder Archivierungslösungen können eingesetzt werden, um das Management des Informationslebenszyklus und die Wahl des passenden Speichermediums zu automatisieren.

4. Die Eignung bestimmter Daten für die Open Hybrid Cloud prüfen

Nach Klärung der grundlegenden Bedingungen können Unternehmen eine Entscheidung treffen, welche Daten, etwa aus Compliance-Gründen, weiterhin im Rechenzentrum vor Ort und welche in der Cloud gespeichert werden können.
Die Vorteile einer sicheren Speicherung in der Cloud liegen auf der Hand: Es müssen keine kostspieligen Investitionen in neue Speichersysteme getätigt werden und vor allem entfallen zusätzliche Aufwendungen für den Betrieb und die regelmäßige Datensicherung und Disaster-Recovery-Maßnahmen, da diese üblicherweise in den Cloud-Dienstleistungen enthalten sind.
Cloud-Storage kann aber auch zur Entlastung der lokalen Speicherkapazitäten im Rechenzentrum verwendet werden wie zum Beispiel durch die Auslagerung von Backup- und Disaster-Recovery Images in die Cloud. Die meisten gängigen Enterprise-Backup-Lösungen unterstützen den direkten Datentransfer in die Cloud.

5. Anforderungen wie Verfügbarkeit, Latenzzeiten und Datensicherheit beachten

Die Schaffung der organisatorischen Voraussetzungen im Unternehmen, um zumindest ausgewählte unstrukturierte Datenbestände in eine Open Hybrid Cloud zu migrieren, ist die eine Seite der Medaille. Die andere Seite ist die Klärung und Festlegung zentraler Anforderungen an den Cloud Provider.
Dazu zählen Aspekte wie Verfügbarkeit, Performance und die Latenz der Datenverbindungen. Unternehmen mit vielen Standorten sollten Außenstellen mit einem eigenen lokalen Internetzugang ausstatten, um die Gateways in der Firmenzentrale zu entlasten.

6. Mit einem überschaubaren Pilotprojekt starten

Die Migration unstrukturierter Daten in eine Open Hybrid Cloud ist aus organisatorischer und IT-Sicht ein anspruchsvolles Projekt mit vielfältigen Implikationen. Um erste Erfahrungen zu sammeln, sollten Unternehmen in einem klar umgrenzten Anwendungsszenario ihre Vorstellungen und Anforderungen testen. Auf dieser Basis können dann weitere Datenbestände migriert und die Adaption von Cloud Services weiter vorangetrieben werden.

Dropbox-Alternativen -
So schnell ist ein entscheidender Teil der Schatten-IT eingerichtet:
Die Nutzer können einfach und schnell Dropbox installieren und an der IT vorbei auf ihren Systemen einsetzen.
Ein probates Mittel, das die meisten Anwender vom Dropbox-Einsatz abhalten wird
Im eigenen DNS-Server wird eine neue Zone für „dropbox.com“ eingerichtet.
Vor der Manipulation:
Die normale Namensauflösung gibt die IP-Adressen zurück, die für den Zugriff auf die Dropbox-Ordner benötigt werden.
Nach dem Eintrag der „neuen Dropbox-Zone“ im DNS-Server:
Es ist dem Nutzer nicht mehr möglich, auf normale Weise auf seine Dropbox-Ordner zuzugreifen.
Klare, strukturierte Oberfläche in deutscher Sprache:
Schon bei der Anmeldung zeigen die Macher von „box“, das sie auch den hiesigen Markt gut bedienen. Allerdings gibt es hier keine kostenlose Testversion ohne Angabe von Zahlungsdaten!
Tablet-optimierter Client für Windows 8/8.1-Systeme:
Die von „box“ für die modernen Windows-Versionen bereitgestellte App erlaubt einfaches und schnelles Arbeiten auch auf den Tablets, stellt aber insgesamt weniger Verwaltungsmöglichkeiten bereit.
Gute Kontrollmöglichkeiten:
Schon in der freien Version erlaubt es „box“ dem Anwender, sich entsprechende Nachrichten über die Aktivitäten stets aktuell per E-Mail schicken zu lassen.
Zwei Versionen:
Wie die meisten anderen Anbieter, stellt auch Trend Micro jeweils eine Version seiner Cloud-Software für private Nutzer und eine für den Business-Einsatz bereit.
Das Bearbeiten der Daten im Browser:
Die Web-Oberfläche von SafeSync ist eher traditionell aufgebaut und arbeitet unter JavaScript. Sie stellt dem Nutzer aber alle Möglichkeiten, wie hier die Erstellung eines Links zur Freigabe eines Ordners, zur Verfügung.
Wer hat wann welche Aktion ausgeführt:
Das Protokoll der SafeSync-Lösung zeigt, welche Daten beispielsweise in den Teamspaces gelöscht oder verändert werden und welcher Nutzer dies getan hat.
Gute Integration in das Betriebssystem:
Der Windows-Client der SafeSync-Lösung erlaubt es, die Ordner der Teamspaces entsprechend auf lokalen Ordnern abzubilden und diese automatisch zu synchronisieren.
Übersichtliche Oberfläche unter HTML 5:
Die Plattform Grau DataSpace 2.0 stellt den Nutzern weitreichende Möglichkeit für Verwaltung, Bearbeitung und Austausch auch von sicherkritischen Daten in sogenannten sicheren Datenräumen.
Wie lange soll ein Link auf ein bestimmtes Dokument zur Verfügung stehen?
Nutzer können bei DataSpace 2.0 einen Link entsprechend terminieren, was die Sicherheit eines solchen Austausches deutlich erhöht.
Enterprise Content Management auf Dropbox-Art:
Anbieter Grau stellt mit DataSpace Sync ein Open-Source-Programm bereit, mit dem der Zugriff auf die freigegeben Datenräume in den Explorer integriert wird.