Technologien für große Datenmengen

Big Data im Griff

Dr. Klaus Manhart hat an der LMU München Logik/Wissenschaftstheorie studiert. Seit 1999 ist er freier Fachautor für IT und Wissenschaft und seit 2005 Lehrbeauftragter an der Uni München für Computersimulation. Schwerpunkte im Bereich IT-Journalismus sind Internet, Business-Computing, Linux und Mobilanwendungen.

Datenbanken für Big Data

Softwareseitig stoßen bei Big Data vor allem die herkömmlichen Datenbanken an ihre Grenzen. Sie können schlecht mit unstrukturierten Daten in Nicht-SQL-Formaten wie Bildern, Sounds oder E-Mail-Anhängen umgehen - also dem Löwenanteil bei hochvolumigen Datenmengen. Übliche relationale Datenbanksysteme und Analysetechniken kommen mit den unterschiedlichen Datentypen nicht zurecht.

Für unstrukturierte Daten gibt es Techniken wie NoSQL-Datenbanken. NoSQL ist der Sammelbegriff für nicht-relationale Datenbanksysteme und zugleich der Name einer Bewegung weg von den relationalen Datenbanken hin zu neuen beziehungsweise vergessenen Datenbankmodellen. Diese Datenbanksysteme lassen sich ergänzend zu den klassischen Datenbanken einsetzen. Sie können dann wieder in strukturierte Datensysteme überführt und als Kennzahlen beispielsweise in ein Datawarehouse eingespeichert werden.

NoSQL-Datenbanken wie die Opensource-Lösung Hadoop bieten ein hochskalierbares Filesystem, um unterschiedlich strukturierte Daten zu speichern. Außerdem verfügen sie über eine Entwicklungsumgebung, um Programme für eine parallelisierte Datenverarbeitung zu erstellen.

Zur Startseite