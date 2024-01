Günstige Server- und Speicherkapazitäten, der zunehmende Einsatz von Hybrid-Clouds und das exponentielle Wachstum von KI führen dazu, dass die Datenmengen rasant ansteigen. In mehr als der Hälfte aller Unternehmen wächst das Datenvolumen bereits um durchschnittlich 50 Prozent pro Jahr. Dies bringt nicht nur aus Compliance-Sicht Herausforderungen mit sich. Die Speicherung großer Datenmengen benötigt auch viel Strom, bei KI-basierten Prozessen gilt das um so mehr. ChatGPT beispielsweise verbraucht bis zu zehnmal mehr Strom als eine Standard-Datensuche.

Obwohl die Effizienz der Rechenzentren (PUE) ansteigt, ist es nicht möglich, die erhöhte Arbeitslast auch nur ansatzweise auszugleichen. Bis 2030 werden wir allein in Europa 250 Prozent mehr Wasser und 378 Prozent mehr Energie mit unserem Datenkonsum verbrauchen - das ist bereits in sieben Jahren.

Abspecken - nicht nur der Umwelt zuliebe

Obwohl wir uns inmitten einer Klimakrise befinden, sind die Bemühungen von Unternehmen und IT-Branche noch immer nicht ausreichend, um die Datenmengen und damit den Wasser- und Energieverbrauch zu reduzieren. Alleine durch eine höhere Effizienz im Datenmanagement lässt sich das Problem nicht lösen. Denn es werden einfach viel zu viele Daten gespeichert - und das auch viel zu lange.

Daher sollten Unternehmen sich selbst eine "Datendiät" verordnen und überflüssige "Datenpfunde" verlieren. Die Möglichkeiten dafür sind vorhanden und bestehen aus einer Kombination neuer und herkömmlicher Ansätze.

Datenidentifizierung und -klassifizierung mit KI

In vielen Unternehmen ist die Infrastruktur mit unstrukturierten "dunklen" Daten vollgestopft. Durchschnittlich kennen Firmen die Inhalte von 70 Prozent dieser Daten überhaupt nicht. Darunter sind veraltete Produkt- und Unternehmensbilder ebenso zu finden wie überflüssige Kopien von Datenbanken oder Produktionsdate. Eine Untersuchung der Enterprise Strategy Group (ESG) zeigt in diesem Kontext, dass Unternehmen für jedes Terabyte an Produktionsdaten weitere 4 TB (oder mehr) an sekundären Daten speichern, was die Datenflut noch verstärkt.

KI und maschinelles Lernen können hier helfen und durch die automatische Identifzierung und Klassifizierung von Unternehmensdaten eines der komplexesten Probleme entschärfen. Dabei fischen vordefinierte Filter Compliance-relevante Daten wie Kreditkarten oder andere persönliche Daten sofort aus dem Datenpool und markieren sie. Je länger die KI arbeitet und je mehr Unternehmensdaten sie untersucht, desto genauer werden ihre Ergebnisse. Dadurch sind Unternehmen in die Lage, veraltete, verwaiste und redundante Daten automatisiert zu identifizieren, die sofort gelöscht werden können.

Datenkonsolidierung auf einer zentralen Plattform

Dabei ist es hilfreich, wenn Unternehmen ihre Daten auf einer einheitlichen Plattform konsolidieren, anstatt Dutzende oder gar Hunderte von Silos zu betreiben. Dort lassen sich die Daten mit Standardtechniken wie Deduplizierung und Komprimierung weiter reduzieren. Dieser Ansatz ermöglicht eine gezielte Datenlöschung, die qualitative und quantitative Anforderungen erfüllt. Unternehmen bewahren nur diejenigen Daten auf, die sie aufbewahren müssen, und auch nur für den vorgeschriebenen Zeitraum. Anschließend löschen sie diese automatisch. So verringern sie Datenberge und damit ihren Energie- und Wasserverbrauch.

Ein weiterer Vorteil des präzisen Überblicks über vorhandene Daten: Im Falle eines Cyberangriffs wissen Unternehmen besser, was kompromittiert, verschlüsselt oder entwendet wurde. Gleichzeitig trägt eine höhere Datenqualität dazu bei, dass KI-Technologien wie Machine Learning oder Large Language Models (LLMs) auf solider Basis agieren.

Der achtsamere Umgang mit Daten hat also viele Vorteile. Unternehmen halten rechtliche Vorgaben besser ein, zahlen weniger Geld für Speicherplatz, verbrauchen weniger kostbare Ressourcen und können zudem auf Basis von KI echte Wettbewerbsvorteile erzielen. (mb)