Die Wissenschaft hat festgestellt

Anonymisierte Datensätze nicht so sicher wie gedacht

29.01.2015
Einzelne Menschen lassen sich mitunter mit wenig Aufwand aus großen, anonymisierten Datensätzen herausgepicken.

Das fanden Forscher am US-amerikanischen Massachusetts Institute of Technology (MIT) und der dänischen Universität Aarhus heraus. Sie untersuchten einen Satz Kreditkartendaten von 1,1 Millionen Menschen. Die Daten enthielten weder Namen noch Kontonummern, sondern lediglich Tag, Ort und Höhe der Zahlungen, die von einem bestimmten Konto getätigt worden waren.

"Nur weil ein Datensatz keine Namen, Adressen, Telefonnummern oder andere offensichtliche Merkmale enthält (..) macht ihn das nicht anonym."
"Nur weil ein Datensatz keine Namen, Adressen, Telefonnummern oder andere offensichtliche Merkmale enthält (..) macht ihn das nicht anonym."
Foto: Jürgen Fälchle, Fotolia.de

Dennoch konnten die Forscher einen einzelnen Menschen mit hoher Wahrscheinlichkeit in dem Datensatz wiederfinden. Dazu mussten sie lediglich vier Bezahlvorgänge von ihm kennen und mit dem Datensatz abgleichen. Solche privaten Infos lassen sich etwa aus einem öffentlichen Tweet oder einer Bewertung im Internet ableiten.

Wussten die Forscher auf diese Weise, dass eine Person am Montag einen Kaffee mit der Kreditkarte bezahlt, am Dienstag im Supermarkt eingekauft hatte, am Donnerstag in einem Sportartikelgeschäft und am Freitag in einem Kleidungsladen war, konnten sie den Betreffenden in 90 Prozent der Fälle in dem Datensatz wiederfinden.

Für die Wissenschaftler zeigen die Ergebnisse, dass auch große Datensätze häufig keine umfassende Anonymität bieten. Das gilt nicht nur für Kreditkartendaten. Auch beim Surfen im Internet, beim Benutzen von öffentlichen Verkehrsmitteln oder beim Streamen von Filmen über Online-Dienste fallen massenhaft Daten an, die gesammelt und analysiert werden. Es sei wahrscheinlich, dass auch diese Daten trotz Anonymisierung einfach wieder einzelnen Personen zugeordnet werden könnten, schreiben die Forscher im Fachmagazin "Science" (DOI: 10.1126/science.1256297).

"Nur weil ein Datensatz keine Namen, Adressen, Telefonnummern oder andere offensichtliche Merkmale enthält (..) macht ihn das nicht anonym." Das erfordere eine neue Diskussion über Datenschutz. Denn personenbezogene Daten sind zwar geschützt, anonymisierte Datensätze aber nicht. "Unsere Ergebnisse zeigen, dass eine Reform unseres Datenschutzes nötig ist, die über personenbezogene Daten hinaus geht." (dpa/tc)

Zur Startseite