Definition

Was ist Anonymisierung?

| Autor / Redakteur: Stefan Luber / Nico Litzel

(Bild: © aga7ta - stock.adobe.com)

Die Anonymisierung verhindert, dass sich Daten bestimmten Personen zuordnen lassen. Hierfür entfernt, ersetzt, aggregiert oder verfälscht der Vorgang des Anonymisierens personenbezogene Daten oder personenbeziehbare Daten. Für vollständig anonymisierte Daten gelten bestimmte Vorgaben der DSGVO nicht. Zwischen Anonymisierung und Pseudonymisierung bestehen deutliche Unterschiede.

Im Umfeld der Datenverarbeitung bezeichnet der Begriff Anonymisierung einen Bearbeitungsvorgang, der personenbezogene Daten oder personenbeziehbare Daten verfälscht, entfernt, ersetzt oder aggregiert, sodass Daten nicht mehr oder nur mit unverhältnismäßig großem Aufwand bestimmten Personen zugeordnet werden können. Der Begriff der Anonymisierung ist unter anderem im alten BDSG (Bundesdatenschutzgesetz) definiert. In der Datenschutzgrundverordnung (DSGVO) ist festgehalten, dass zahlreiche Anforderungen der DSGVO für anonyme Daten keine Anwendung finden. Jedoch haben die für die Datenverarbeitung Verantwortlichen laut DSGVO nachzuweisen, dass es sich tatsächlich um anonyme Daten handelt. Die sogenannte Pseudonymisierung ist in der Regel nicht ausreichend.

Abgrenzung zwischen Anonymisierung und Pseudonymisierung

Im Umfeld der Anonymisierung von Daten fällt häufig der Begriff Pseudonymisierung. Die Pseudonymisierung unterscheidet sich deutlich von der Anonymisierung und erzeugt keine vollständig anonymen Daten. Der Unterschied zwischen der Anonymisierung und der Pseudonymisierung besteht darin, dass bei der Pseudonymisierung eine grundsätzliche Zuordnungsmöglichkeit der Daten zu bestimmten Personen bestehen bleibt. Allerdings ist diese ausgelagert und auf konkrete Verantwortungsbereiche beschränkt.

Bei anonymen Daten ist keinerlei Zuordnungsmöglichkeit mehr gegeben. In pseudonymen Daten bleiben die Bezüge der Datensätze grundsätzlich bestehen, allerdings werden sie durch Schlüssel oder Pseudonyme für die eigentlichen Nutzer der Daten anonymisiert. Die Identifikationsmerkmale und Daten sind praktisch getrennt und nur unter definierten Voraussetzung zugänglich.

Welche Daten sind zu anonymisieren?

Von der Anonymisierung sind alle Daten betroffen, die personenbezogen oder personenbeziehbar sind. Personenbezogene Daten sind beispielsweise Namen, Adressen oder Telefonnummern. Unter personenbeziehbaren Daten oder Merkmalen versteht man Informationen, mit denen eine Person zwar nicht direkt und eindeutig identifizierbar ist, aber die es erlauben, durch die Kombination von Daten oder das Analysieren von Beziehungen auf Personen zu schließen. Oft ist es schwierig, Daten hinsichtlich personenbeziehbarer Informationen zu anonymisieren, da durch das Vorhandensein externer Datenquellen und die Kombination mit den anonymisierten Daten neue personenbeziehbare Abhängigkeiten entstehen können. So kann beispielsweise alleine durch die Erwähnung eines Berufs und eines Orts in einer Datensammlung unter Umständen auf eine Person und ihre Adresse geschlossen werden, falls der Beruf nur einmal an einem Ort existiert und die Information mit einer weiteren öffentlich zugänglichen Datensammlung wie einem Telefonbuch kombiniert wird.

Typische zu anonymisierende Daten sind:

  • Namen von Personen
  • Adressen von Personen
  • Geburtsdaten
  • Telefonnummern
  • Kennzeichen von Fahrzeugen
  • Berufe
  • Seriennummern
  • E-Mailadressen
  • IP-Adressen
  • Nummern persönlicher Akten
  • Mitgliedsnummern in bestimmten Organisationen oder Vereinigungen
  • biometrische Daten wie Fotografien des Gesichts oder Fingerabdruckdaten
  • Zahlungsdaten mit personenbezogenen Informationen
  • Bestelldaten mit personenbezogenen Informationen
  • Ausweisdaten
  • alle eindeutig auf bestimmte Personen verweisende Nummern

Verfahren zur Anonymisierung der Daten

Zur Anonymisierung der Daten kommen verschiedene Verfahren zum Einsatz. Diese Verfahren sind beispielsweise:

  • Das Löschen der Daten oder Merkmale und Ersetzen durch Platzhalter,
  • das Verfälschen der Daten,
  • das Trennen der Daten,
  • das Aggregieren der Daten oder
  • das Ersetzen der Daten mit vergleichbaren Informationen.

Bei der einfachsten Form der Anonymisierung werden Daten oder Merkmale durch Platzhalter ersetzt, um dadurch die Abstraktion von der ursprünglich personenbezogenen Information zu erreichen. Die Aggregierung der Daten erzeugt Klassen und Kategorien, denen die Daten zugeordnet werden. In den anonymisierten Daten sind dann nur noch die aggregierten Informationen der Klassen und Kategorien und nicht mehr die Einzeldaten selbst vorhanden.

Eine weiteres Verfahren der Anonymisierung ist das Ersetzen der Daten mit Informationen vergleichbarer Bedeutung. So lassen sich Personen beispielsweise durch die Informationen „Mutter“ und „Tochter“ miteinander in Beziehung setzen, ohne dass konkrete Daten über die Personen selbst in den Daten vorliegen müssen.

Beispiele für die Anonymisierung der Daten

Für die Anonymisierung der Daten existieren zahlreiche Beispiele. Eine Bundestagswahl findet beispielsweise vollständig anonym statt und die vorliegenden Daten sind bezüglich des Wahlinhalts einzelner Personen anonym. Es lässt sich zwar nachvollziehen, wer sich an der Wahl beteiligt hat und wer nicht und welche Parteien wie viele Stimmen bekommen haben, welche Person aber welche Partei gewählt hat, ist nicht rekonstruierbar.

Ein weiteres Beispiel für die Anonymisierung der Daten ist das Löschen der personenbezogenen Daten aus Bestelldaten. Die Bestelldaten lassen sich anschließend für verschiedenste Zwecke wie Marketingzwecke analysieren, auch unternehmensextern. Allerdings lässt sich nicht mehr darauf schließen, welche Personen welche Produkte bestellt haben.

Die Auswertung der Besucherinformationen von Webseiten oder Onlineshops lässt sich ebenfalls in anonymer Form durchführen, indem aus den erhobenen Statistikdaten eines Webservers personenbezogene Daten wie IP-Adressen oder Usernamen entfernt werden.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Aktuelle Beiträge zu diesem Thema

Informatica stellt Data Engineering vor

End-to-End-Datenmanagement

Informatica stellt Data Engineering vor

Mit seiner neuen Data-Engineering-Lösung will Informatica kritische Lücken in der Unternehmens-KI, beim Machine Learning und bei Analytics-Initiativen schließen. lesen

Qlik setzt auf Augmented Intelligence und die Multi-Cloud

Nachbericht Qlik Data Revolution Tour 2019

Qlik setzt auf Augmented Intelligence und die Multi-Cloud

Auf der Kundenveranstaltung „Data Revolution Tour 2019“ zeigte der BI-Anbieter Qlik die breite Palette seiner Angebote in einer Multi-Cloud-Plattform. Sie werden u. a. bei Porsche AG genutzt. An Neuheiten stellte die Forschungsleitern Elif Tutuk „Qlik Insight Bot“ und „Qlik Insight Advisor“ mit Sprachunterstützung vor. lesen

Künstliche Intelligenz datenschutzkonform entwickeln

Privatsphäre

Künstliche Intelligenz datenschutzkonform entwickeln

Damit Künstliche Intelligenz intelligent wird, braucht sie Daten – doch die sind in vielen Bereichen sensibel. Die Technologie des Federated Learning bietet einen Lösungsansatz – ein Berliner Start-up hat dazu eine Plattform entwickelt. lesen

So gelingt eine DSGVO-konforme Data Analytics

Kommentar von Sebastian Weyer, Statice

So gelingt eine DSGVO-konforme Data Analytics

Die Datenschutzgrundverordnung stellt viele Unternehmen vor die Herausforderung, den Spagat zwischen Datenschutz und der Notwendigkeit, Daten-getriebene Innovationen auf den Weg zu bringen, zu meistern. Wie vertragen sich Datenschutz und Datennutzung in einem auf Fortschritt bedachten Unternehmen? lesen

Automatische Bilderkennung gegen Kinderpornografie

Forschungsprojekt gestartet

Automatische Bilderkennung gegen Kinderpornografie

Im Rahmen eines gemeinsamen Projekts erforschen das Justizministerium Nordrhein-Westfalen (NRW), die Zentral- und Ansprechstelle Cybercrime (ZAC NRW) und Microsoft den Einsatz von Künstlicher Intelligenz (KI) bei der Beweissicherung. lesen

Pseudonymisierung vs. Anonymisierung gemäß der DSGVO

Kommentar von Gary LaFever, Anonos, und Stefan Müller, IT-Novum

Pseudonymisierung vs. Anonymisierung gemäß der DSGVO

Obwohl die DSGVO längst in Kraft getreten ist, gibt es weiterhin viel Klärungsbedarf. Ein Grund ist die mangelnde Wahrnehmung einiger grundlegender Konzepte der Datenschutzverordnung. Bei vielen Kunden fällt uns auf, dass zwar der Begriff der Anonymisierung häufig im Zusammenhang fällt, aber großes Unwissen über das Konzept der Pseudonymisierung herrscht. Letztere ist mindestens genauso wichtig wie erstere, denn nur wenn sie erfüllt ist, dürfen personenbezogene Daten weiterhin ausgewertet werden. lesen

Datenschutz und Big Data helfen sich gegenseitig

E-Book von BigData-Insider

Datenschutz und Big Data helfen sich gegenseitig

Für den Datenschutz ist Big Data ein mögliches Datenrisiko. Für Big Data hingegen scheint der Datenschutz ein großer Hemmschuh oder sogar Verhinderer zu sein. Das neue E-Book zeigt, wie sich die Datenschutzvorgaben bei Big Data umsetzen lassen, ohne den Geschäftserfolg zu verhindern. Ebenso zeigt das E-Book, dass Big Data durchaus wertvoll für den Datenschutz ist. lesen

Daten sind die neue Leitwährung

Kommentar von Sunil Senan, Infosys

Daten sind die neue Leitwährung

Mitte der Neunziger Jahre gewann das Internet an Popularität. Diese neue Technologiewelle vernetzte Unternehmen, Verbraucher, Mitarbeiter und Bürger in einer Art und Weise, die zuvor nicht möglich war. Seitdem entstanden eine Vielzahl von E-Commerce-, B2B-, B2E (Business-to-Employee)-, G2C (Government-to-Citizen)-Portalen sowie das Internet der Dinge (IoT). Damit wurde das Internet zu einer Art Leitwährung des neuen digitalen Zeitalters. lesen

Wie wirkt sich die Fußball-WM auf den Verkehr in Deutschland aus?

Anonymisierte Bewegungsdaten

Wie wirkt sich die Fußball-WM auf den Verkehr in Deutschland aus?

Die Fußball-WM endete für Deutschland mit dem unerwarteten Aus in der Vorrunde. Wie aber haben sich an den Spieltagen die Verkehrsströme in Deutschland verändert? Telefónica Next hat dies und weitere Aspekte nun im Auftrag des Bundesverbands Digitale Wirtschaft untersucht. lesen

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 46353434 / Definitionen)