Definition Was ist Anonymisierung?

Autor / Redakteur: Dipl.-Ing. (FH) Stefan Luber / Nico Litzel |

Die Anonymisierung verhindert, dass sich Daten bestimmten Personen zuordnen lassen. Hierfür entfernt, ersetzt, aggregiert oder verfälscht der Vorgang des Anonymisierens personenbezogene Daten oder personenbeziehbare Daten. Für vollständig anonymisierte Daten gelten bestimmte Vorgaben der DSGVO nicht. Zwischen Anonymisierung und Pseudonymisierung bestehen deutliche Unterschiede.

Anbieter zum Thema

(Bild: © aga7ta - stock.adobe.com)

Im Umfeld der Datenverarbeitung bezeichnet der Begriff Anonymisierung einen Bearbeitungsvorgang, der personenbezogene Daten oder personenbeziehbare Daten verfälscht, entfernt, ersetzt oder aggregiert, sodass Daten nicht mehr oder nur mit unverhältnismäßig großem Aufwand bestimmten Personen zugeordnet werden können. Der Begriff der Anonymisierung ist unter anderem im alten BDSG (Bundesdatenschutzgesetz) definiert. In der Datenschutzgrundverordnung (DSGVO) ist festgehalten, dass zahlreiche Anforderungen der DSGVO für anonyme Daten keine Anwendung finden. Jedoch haben die für die Datenverarbeitung Verantwortlichen laut DSGVO nachzuweisen, dass es sich tatsächlich um anonyme Daten handelt. Die sogenannte Pseudonymisierung ist in der Regel nicht ausreichend.

Abgrenzung zwischen Anonymisierung und Pseudonymisierung

Im Umfeld der Anonymisierung von Daten fällt häufig der Begriff Pseudonymisierung. Die Pseudonymisierung unterscheidet sich deutlich von der Anonymisierung und erzeugt keine vollständig anonymen Daten. Der Unterschied zwischen der Anonymisierung und der Pseudonymisierung besteht darin, dass bei der Pseudonymisierung eine grundsätzliche Zuordnungsmöglichkeit der Daten zu bestimmten Personen bestehen bleibt. Allerdings ist diese ausgelagert und auf konkrete Verantwortungsbereiche beschränkt.

Bei anonymen Daten ist keinerlei Zuordnungsmöglichkeit mehr gegeben. In pseudonymen Daten bleiben die Bezüge der Datensätze grundsätzlich bestehen, allerdings werden sie durch Schlüssel oder Pseudonyme für die eigentlichen Nutzer der Daten anonymisiert. Die Identifikationsmerkmale und Daten sind praktisch getrennt und nur unter definierten Voraussetzung zugänglich.

Welche Daten sind zu anonymisieren?

Von der Anonymisierung sind alle Daten betroffen, die personenbezogen oder personenbeziehbar sind. Personenbezogene Daten sind beispielsweise Namen, Adressen oder Telefonnummern. Unter personenbeziehbaren Daten oder Merkmalen versteht man Informationen, mit denen eine Person zwar nicht direkt und eindeutig identifizierbar ist, aber die es erlauben, durch die Kombination von Daten oder das Analysieren von Beziehungen auf Personen zu schließen. Oft ist es schwierig, Daten hinsichtlich personenbeziehbarer Informationen zu anonymisieren, da durch das Vorhandensein externer Datenquellen und die Kombination mit den anonymisierten Daten neue personenbeziehbare Abhängigkeiten entstehen können. So kann beispielsweise alleine durch die Erwähnung eines Berufs und eines Orts in einer Datensammlung unter Umständen auf eine Person und ihre Adresse geschlossen werden, falls der Beruf nur einmal an einem Ort existiert und die Information mit einer weiteren öffentlich zugänglichen Datensammlung wie einem Telefonbuch kombiniert wird.

Typische zu anonymisierende Daten sind:

  • Namen von Personen
  • Adressen von Personen
  • Geburtsdaten
  • Telefonnummern
  • Kennzeichen von Fahrzeugen
  • Berufe
  • Seriennummern
  • E-Mailadressen
  • IP-Adressen
  • Nummern persönlicher Akten
  • Mitgliedsnummern in bestimmten Organisationen oder Vereinigungen
  • biometrische Daten wie Fotografien des Gesichts oder Fingerabdruckdaten
  • Zahlungsdaten mit personenbezogenen Informationen
  • Bestelldaten mit personenbezogenen Informationen
  • Ausweisdaten
  • alle eindeutig auf bestimmte Personen verweisende Nummern

Verfahren zur Anonymisierung der Daten

Zur Anonymisierung der Daten kommen verschiedene Verfahren zum Einsatz. Diese Verfahren sind beispielsweise:

  • Das Löschen der Daten oder Merkmale und Ersetzen durch Platzhalter,
  • das Verfälschen der Daten,
  • das Trennen der Daten,
  • das Aggregieren der Daten oder
  • das Ersetzen der Daten mit vergleichbaren Informationen.

Bei der einfachsten Form der Anonymisierung werden Daten oder Merkmale durch Platzhalter ersetzt, um dadurch die Abstraktion von der ursprünglich personenbezogenen Information zu erreichen. Die Aggregierung der Daten erzeugt Klassen und Kategorien, denen die Daten zugeordnet werden. In den anonymisierten Daten sind dann nur noch die aggregierten Informationen der Klassen und Kategorien und nicht mehr die Einzeldaten selbst vorhanden.

Eine weiteres Verfahren der Anonymisierung ist das Ersetzen der Daten mit Informationen vergleichbarer Bedeutung. So lassen sich Personen beispielsweise durch die Informationen „Mutter“ und „Tochter“ miteinander in Beziehung setzen, ohne dass konkrete Daten über die Personen selbst in den Daten vorliegen müssen.

Beispiele für die Anonymisierung der Daten

Für die Anonymisierung der Daten existieren zahlreiche Beispiele. Eine Bundestagswahl findet beispielsweise vollständig anonym statt und die vorliegenden Daten sind bezüglich des Wahlinhalts einzelner Personen anonym. Es lässt sich zwar nachvollziehen, wer sich an der Wahl beteiligt hat und wer nicht und welche Parteien wie viele Stimmen bekommen haben, welche Person aber welche Partei gewählt hat, ist nicht rekonstruierbar.

Ein weiteres Beispiel für die Anonymisierung der Daten ist das Löschen der personenbezogenen Daten aus Bestelldaten. Die Bestelldaten lassen sich anschließend für verschiedenste Zwecke wie Marketingzwecke analysieren, auch unternehmensextern. Allerdings lässt sich nicht mehr darauf schließen, welche Personen welche Produkte bestellt haben.

Die Auswertung der Besucherinformationen von Webseiten oder Onlineshops lässt sich ebenfalls in anonymer Form durchführen, indem aus den erhobenen Statistikdaten eines Webservers personenbezogene Daten wie IP-Adressen oder Usernamen entfernt werden.

(ID:46353434)