Wissen für Reseller

Die 10 wichtigsten Technologien der Zukunft

04.12.2009
Von Ruwen Schwerin

Platz 3: Datendeduplizierung

Die Daten sind die Lebensader jedes Unternehmens. Das Problem ist, wie man mit ihnen umgeht. Laut IDC verdoppeln sich die Daten der Unternehmen alle 18 Monate, was die Speichersysteme teilweise bis an ihr Maximum belastet. Schuld an dieser Entwicklung ist die Vorratsspeicherung. Hier ist wesentlich, dass es kein Ablaufdatum für die einzelnen Daten gibt, da die Analyse der Daten aus den vorherigen Jahren zum erstellen von Prognosen und Aufdecken von Trends benötigt werden.

Es müsste eine Möglichkeit geben, die enormen Speicheranforderungen all dieser Daten zu reduzieren, ohne dabei nützliche Informationen zu verlieren. Und die gibt es dank einer Technologie, die als Datendeduplizierung bekannt ist.

Jedes Netzwerk enthält Unmengen von doppelten Daten, von identischen Backup-Daten, Tausenden Kopien eines Handbuchs, bis hin zu identischen Dateianhängen auf dem selben E-Mail-Server. Die Grundidee der Datendeduplizierung ist, doppelte Kopien der gleichen Datei zu suchen und alle außer dem Original zu beseitigen. Jedes Duplikat wird durch einen einfachen Platzhalter-Hinweis auf die Originaldatei ausgetauscht. Wenn der Benutzer eine Datei anfordern, leiten die Platzhalter sie an das Original weiter und in der Handhabung ist kein Unterschied ersichtlich. So können redundante Daten aufgespürt und überflüssig gemacht werden.

Deduplizierung gibt es in verschiedenen Formen, von der einfachen Datei-Erkennung bis hin zu fortgeschrittenen Methoden der Suche direkt in Dateien auf Block- oder Byte-Ebene. Grundsätzlich funktioniert Deduplizierungssoftware durch die Analyse von Daten, sei es ein Block, eine Reihe von Bits, oder die gesamte Datei. Durch einen Algorithmus erhalten die einzelnen Daten einen eindeutigen Hashwert. Wenn ein Hashwert bereits im Index ist, heißt das, dass diese Daten nicht erneut gespeichert werden müssen. Wenn nicht, wird der Hash in den Index aufgenommen. So geht es dann immer weiter.

Datendeduplizierung ist nicht nur für die Daten eines Datei- oder E-Mail-Systems angelegt. Die Vorteile für Backups, insbesondere im Hinblick auf die Wiederherstellung bei völligem Datenverlust, sind massiv. Der Prozentsatz der täglich geänderten Daten ist relativ gering. Bei der Übertragung eines Backups über das WAN gibt es wirklich keine Notwendigkeit, täglich die gleichen Bytes zu sichern, Nacht für Nacht. Durch die Verwendung der Deduplizierung reduzieren Sie die Größe der Sicherung erheblich. Die Ausnutzung der WAN-Bandbreite geht zurück und die Back-up-Möglichkeiten werden schneller und komfortabler.

Mehr und mehr Backup-Produkte nutzen die Vorteile der Deduplizierung und die entsprechenden Geräte und die Technik wurde in den vergangenen Jahren immer besser. Deduplizierung für das ganze Dateisystem ist ebenfalls auf einem guten Weg. Wenn es um die Lösung der drückendsten IT-Problemen geht, bieten nur wenige Technologien mehr Aussicht auf eine umfassende Problemlösung als die Datendeduplizierung.

Zur Startseite