In vielen Branchen sind genügend Daten für Big-Data-Analysen vorhanden. Zuvor sollten sich Unternehmen aber die vier wichtige Fragen beantworten.
von Werner Kurzlechner (freier Mitarbeiter bei der CP-Schwesterpublikation CIO)
Big Data ist ein aktueller IT-Hype. Und Big Data ist das Versprechen an die Anwender, ihre Geschäftsprozesse signifikant zu verbessern. Wie stets bei jungen Technologien, für die noch keine Business Cases auf breiter Basis vorhanden sind, gibt es aber auch eine Menge Unsicherheit, ob und wie man sich dem Thema annähern soll. Für unsere amerikanische Schwesterpublikation CIO.com beantwortet Reda Chouffani die vier wichtigsten Fragen in diesem Zusammenhang. Chouffani ist Vice President beim Anbieter Biz Technology Solutions, der Unternehmen in den südöstlichen USA mit Business Intelligence (BI), Enterprise Resource Planning (ERP) und IT-Infrastruktur ausstattet.
1. Welche Daten kommen in Frage?
Chouffani klärt erst einmal über die drei verschiedenen Datenformate auf. Erstens strukturierte Daten, die so aufbereitet sind, dass sowohl Rechner als auch Menschen sie lesen können – zum Beispiel das Material einer relationalen Datenbank. Zweitens halbstrukturierte Daten, denen es an einer solchen formalen Struktur fehlt, die aber dennoch Tags enthalten, die semantische Elemente separieren. Der Autor nennt als Beispiele XML, E-Mail und Electronic Data Interchange (EDI). Drittens unstrukturierte Daten wie Bilder, Videos und Audio-Dateien, die nicht Teil von Datenbanken sind.
- 4 Kriterien, die für Big Data kennzeichnend sind (Quelle: IDC, 10/2012)
- Big Data Technologie-Stack (Quelle: IDC, 10/2012)
- Permanentes Datenwachstum (Quelle: IDC, 10/2012)
- Datenwachstum aus unterschiedlichsten Quellen (Quelle: IDC, 10/2012)
- Einschätzungen der Anwender zum Datenwachstum (Quelle: IDC, 10/2012)
- Herausforderung bei Datenmanagement und Datenhaltung (Quelle: IDC, 10/2012)
- Technologische Herausforderungen beim Datenmanagement(Quelle: IDC, 10/2012)
- Was ist neu an der Big-Data-Technologie? (Quelle: IDC, 10/2012)
- Neue Generation von Technologien und Architekturen(Quelle: IDC, 10/2012)
- Big Data: Lösungen und Technologie (Quelle: IDC 10/2012)
- Big Data - Herausforderungen aus Sicht der IT-Entscheider(Quelle: IDC, 10/2012)
- Potenzial von Big Data aus Business-Sicht (Quelle: IDC, 10/2012)
- Big-Data-relevante Geschäftsbereiche (Quelle: IDC, 10/2012)
- Organisationsmodelle für Big Data (Quelle: IDC, 10/2012)
- Welche Anbieter bevorzugen Anwender bei der Umsetzung von Big-Data-Projekten? (Quelle: IDC, 10/2012)
- Wie groß sind 1 Zettabyte? (Quelle: IDC, 10/2012)
„Die dringlichste Herausforderung ist die Notwendigkeit, diese Daten freizugeben und Zugang zu ihnen zu gewinnen, um sie speichern und verwenden zu können“, so Chouffani. Dabei könnten die Daten im Rohzustand verbleiben und zugleich in Echtzeit ins Analyse-System einfließen, wo sie analysiert werden und als Basis für Berichte dienen können. Bei strukturierten Daten verlaufe dieser Prozess recht geradlinig; bei unstrukturierten Daten seien fortgeschrittene Algorithmen und starke Engines nötig.
2. Wie werden die Daten gesammelt?
Der Autor verweist auf eine ganze Fülle von Datenquellen. Zu entscheiden sei, welche Daten tatsächlich benötigt werden. Eine der meistdiskutierten Quellen sei Social Media, weil Firmen sich Erkenntnisse über ihre Kunden und ihre Marken erhoffen. In Frage kommt dieses Material deshalb, weil Facebook, Twitter und andere große Social Media-Seiten in der Regel durch ein Application Programming Interface (API) Zugang zu dieser Sorte Daten gewähren.