Technologien für große Datenmengen

Big Data im Griff

Dr. Klaus Manhart hat an der LMU München Logik/Wissenschaftstheorie studiert. Seit 1999 ist er freier Fachautor für IT und Wissenschaft und seit 2005 Lehrbeauftragter an der Uni München für Computersimulation. Schwerpunkte im Bereich IT-Journalismus sind Internet, Business-Computing, Linux und Mobilanwendungen.

Flaschenhälse Storage und Netz

Fujitsu's ETERNUS DX-Systeme etwa bieten die Möglichkeit, von einem Entry- über ein Midrange- bis hin zu einem Highend-System zu wachsen.
Fujitsu's ETERNUS DX-Systeme etwa bieten die Möglichkeit, von einem Entry- über ein Midrange- bis hin zu einem Highend-System zu wachsen.
Foto: Fujitsu

Technisch muss beim Umgang mit Big Data an verschiedenen Stellschrauben gedreht werden. Da ist einmal die Storage-Technik. Mit den rasant wachsenden Datenbergen droht die herkömmliche, statisch ausgelegte Festplattentechnik zu einem Flaschenhals zu werden.

Storage-Hersteller arbeiten deshalb gerade daran, die Performance mit Flash-basierenden SSDs zu pushen. Storage-Systeme sollten im Zuge von Big Data zudem dynamisch und flexibel ausbaubar sein. Fujitsus ETERNUS DX-Systeme etwa bieten mit der Funktion "Data in Place" die Möglichkeit, von einem Entry- über ein Midrange- bis hin zu einem Highend-System zu wachsen.

Darüber hinaus sind in nächster Zeit leistungsfähigere Storage-Techniken zu erwarten, die extrem hohe Speicherdichten ohne Performance-Einbußen erreichen. Auch die zunehmende Nutzung globaler, parallel und verteilt arbeitender File-Systeme, die riesige Datenmengen verwalten können, dürfte zunehmen. Derzeit macht etwa die Open-Source-Variante Lustre von sich reden. Zukunftsfähige Speichersysteme, die sich im Cloud- oder Big-Data-Bereich bewähren sollen, unterstützen am besten mehrere dieser Lösungen.

Ein weiterer Flaschenhals ist die Netztechnik. In klassischen Architekturen werden die Daten von den Plattensystemen zur CPU transportiert, dort verarbeitet und die Resultate wieder zurück in den Storage geschrieben. Dieses Verfahren stößt bei Massendaten bald an seine Grenzen. "Bei der Verarbeitung von Big Data ist zwischen den Compute-Servern und den Storage-Systemen ein Bottleneck zu erwarten", heißt es in einem Experton Statement. Besser geeignet, so Forrester-Analystin Vanessa Alvarez, sind dedizierte Appliances, die Storage, Computing- und Netzressourcen mit Analytics-Funktionen in einem einzigen Gerät kombinieren.

Zur Startseite