Innovation trotz Datenschutz Mit synthetischen Daten zu sicheren KI-Anwendungen

Von Omar Ali Fdal |

Anbieter zum Thema

Daten sind der größte Innovationstreiber des digitalen Zeitalters. Betrachten wir neue Technologien wie IoT-Anwendungen in der fertigenden Industrie, künstliche Intelligenz (KI) oder Anwendungen zum autonomen Fahren, sind diese nur durch die schnelle Auswertung enormer Datenmengen möglich. Synthetische Daten sollen hier einen hohen Informationsgewinn bei gleichzeitig höchsten Datenschutzanforderungen gewährleisten.

Synthetische Daten spielen eine wichtige Rolle für den zukünftigen Erfolg datengetriebener Geschäftsmodelle und können dazu noch dabei helfen, aktuelle Datenschutz-Anforderungen zu erfüllen.
Synthetische Daten spielen eine wichtige Rolle für den zukünftigen Erfolg datengetriebener Geschäftsmodelle und können dazu noch dabei helfen, aktuelle Datenschutz-Anforderungen zu erfüllen.
(Bild: monsitj - stock.adobe.com)

Besonders mit Blick auf das Training von KI-Anwendungen geraten Deutsche Unternehmen und Forschende schnell an Grenzen. Der bremsende Faktor: Die Menge und Qualität der in der EU zur Verfügung stehenden Daten. Dabei wäre es mit Blick auf diese Zukunftstechnologien wichtig, mit der internationalen Konkurrenz Schritt zu halten, um Know-how in Deutschland zu halten und somit langfristig wettbewerbsfähig zu sein. Eine vielversprechende Lösung, auf die Unternehmen in verschiedenen Branchen setzen, sind synthetische Daten. Diese versprechen Unternehmen einen hohen Informationsgewinn, während sie gleichzeitig höchste Datenschutzanforderungen gerecht werden.

Doch nicht nur für noch in der Entwicklung befindliche Technologien ist die Auswertung und Nutzung von Daten essenziell. Die meisten digitalen Geschäftsmodelle wären ohne die genaue Analyse von Produktions-, Standort- aber auch Nutzerdaten nicht denkbar. Diese ermöglichen es Unternehmen nachhaltiger zu wirtschaften und Kundinnen und Kunden ein optimales Einkaufserlebnis und Produktangebot anzubieten.

Willkommen im Land der Datenvorschriften

Viele Unternehmen scheuen allerdings davor zurück, das volle Potenzial der eigenen Daten zu nutzen. Noch schwieriger wird es, wenn es um das Teilen von Daten für Forschungsprojekte oder branchenweite Initiativen geht. Denn beim Thema Daten reden in Deutschland viele Instanzen mit. Unternehmen fühlen sich daher oft gefangen zwischen innovativen Entwicklungen und der Machbarkeit im festgesteckten Rahmen der Behörden und des Datenschutzes. Das Ergebnis: Wichtige Informationen bleiben ungenutzt und Innovation wird ausgebremst.

Seit vier Jahren ist mit der DSGVO die bisher strengste Datenschutzverordnung in Kraft und hat die Art und Weise, wie Unternehmen mit personenbezogenen Daten umgehen müssen, verändert. Erst kürzlich wurde der Hannoverschen Volksbank eine Geldbuße in Höhe von 900.000 Euro auferlegt, da das Finanzinstitut Daten aktueller sowie früherer Kunden ohne deren Einwilligung auswertete, um eine gezieltere Werbeansprache durchführen zu können. Damit ist die DSGVO ein wichtiger Schritt, um die Privatsphäre vieler Menschen zu schützen, aber auch ein Unsicherheitsfaktor für Unternehmen. Auch in Zukunft ist anzunehmen, dass sowohl die Gremien der EU als auch jene auf nationaler Ebene mit ihren Digitalstrategien und der geplanten ePrivacy-Verordnung datengetriebene Geschäftsmodelle von Unternehmen noch stärker regulieren werden.

Neben regionalen Datenschutzverordnungen müssen bei der Verarbeitung von Daten auch internationale Abkommen beachtet werden. Insbesondere Unternehmen, die weltweit agieren oder sogar Niederlassungen in unterschiedlichen Ländern haben, werden hier vor Herausforderungen gestellt. Alleine die Datenübermittlungen zwischen der EU und den USA sind schon äußerst komplex, da die Regulierungen in beiden Ländern sehr unterschiedlich sind. Dass das Datenschutzabkommen zwischen beiden vor kurzem abgelaufen ist und noch keine neue Regelung in Kraft getreten ist, macht die Problematik nicht einfacher. Ähnlich verhält es sich mit Großbritannien, die nach dem Verlassen der EU derzeit an einer eigenen Datenschutzgrundverordnung arbeiten oder Indien, die derzeit auch einen ersten Aufschlag planen. Die unterschiedlichen nationalen Rahmenbedingungen machen eine Harmonisierung zwischen den Ländern nicht nur erforderlich, sondern auch entsprechend komplex.

Besonders Unternehmen in den Bereichen Finanzen, Gesundheit und Versicherungen sind betroffen, da diese mit vielen personenbezogenen Daten arbeiten müssen. Aber auch Wissenschaft und Forschung und eigentlich alle Unternehmen, vor allem diejenigen, die über Ländergrenzen hinweg operieren, brauchen Daten, die sie unbesorgt wirklich verwenden dürfen.

Synthetische Daten in Unternehmen

Eine Lösung für die Herausforderungen an Unternehmen und deren Umgang kann die Verwendung von synthetischen Daten sein. Analystinnen und Analysten von Gartner prognostizieren derzeit, dass in den nächsten zwei Jahren etwa 60 Prozent der Daten, die für die Entwicklung von KI- und Analyseprojekten verwendet werden, synthetisch generiert sein werden. Gleichzeitig kürte das renommierte Innovationsmagazin MIT Technology Review die Technologie jüngst zu einer der 10 Breakthrough Technologies 2022.

Im Gegensatz zu realen Daten, die aus den Informationen von Menschen gewonnen werden, basiert die Erzeugung synthetischer Daten auf Algorithmen des maschinellen Lernens. Bei synthetischen Datensätzen handelt es sich daher nicht um eine Umgestaltung bereits vorhandener Daten – es entsteht ein Satz völlig neuer Datenpunkte. Sowohl die statistischen Eigenschaften der Daten als auch deren Grundstruktur bleiben dabei grundsätzlich erhalten, sodass die neuen Datensätze wie die ursprünglichen verwendet werden können – zum Beispiel für Analysen, das Trainieren von KI-Anwendungen, Tests, Forschung und vieles mehr. Auch das Teilen großer Datensätze mit Geschäfts- und Entwicklungspartnern wird so um ein Vielfaches einfacher und rechtssicherer. Da sich die Synthetisierung durch dieses Vorgehen unendlich skalieren lässt, ist die Technologie für Unternehmen jeder Größe und praktisch jeden Einsatz möglich.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

Durch die Nutzung synthetischer Daten können Unternehmen daher den gleichen Informationsgehalt ziehen wie aus personalisierten Daten, nur dass diese leichter innerhalb und außerhalb der eigenen Organisation geteilt werden können. Dies führt zu einem schnelleren Austausch von Informationen und einem größeren Gewinn an Wissen. Dies kann ein echter Wettbewerbsvorteil gegenüber der Konkurenz sein, gerade wenn es um die Entwicklung neuer Produkte und Services geht. Zudem können intelligente Anwendungen einfacher und größeren Datenmengen trainiert werden, was auch hier die Qualität immens verbessert.

Synthetische Daten in der Versicherungsbranche

An einem Anwendungsfall lässt sich das gut erkennen. Ein kleiner Blick in die Versicherungsbranche zeigt, welchen weiteren Nutzen synthetische Daten haben.

So nutzte der deutsche Versicherer Provinzial synthetische Daten für eine Predictive-Analytics-Empfehlungsmaschine für das "nächstbeste Angebot", um die Bedürfnisse von über einer Million Kunden zu ermitteln. Das Modell "Next Best Offer" sagt die Bedürfnisse der Verbraucher voraus und zeigt ihnen Angebote und Produkte auf der Grundlage ihrer Gewohnheiten. Sie erreichten eine 80-prozentige Verwertbarkeit synthetischer Daten unter Wahrung der Datenanonymität. Darüber hinaus wurde ein maschinelles Lernmodell auf synthetischen Daten trainiert und eine Leistungseffizienz von 97 % erreicht. Prädiktive Analysen helfen Versicherern, verwertbare Erkenntnisse über jeden Aspekt ihres Geschäfts zu gewinnen, das Kundenerlebnis zu verbessern, den Umsatz zu steigern und einen Blick in die Zukunft zu werfen.

Sicherer Umgang mit Daten

Transparente und nachvollziehbare Datenprozesse aufzubauen, in die das gesamte Unternehmen Einblick nehmen kann, anstatt weiter in einer technologischen Blackbox zu arbeiten, öffnet den Weg zu innovativer Datennutzung im ganzen Unternehmen und einem besseren Verständnis für Kundinnen und Kunden. Synthetische Daten spielen eine wichtige Rolle für den zukünftigen Erfolg datengetriebener Geschäftsmodelle. Sie ermöglichen es Unternehmen unabhängig von Datenschutzverordnungen zu agieren und machen die gesamte im Unternehmen vorhandene Datenmasse nutzbar. Dies verschafft Unternehmen einen bedeutenden Wettbewerbsvorteil und die Möglichkeit, sich ganz ohne Ablenkung auf die Entwicklung neuer Produkte und Dienstleistungen zu konzentrieren.

Es ist davon auszugehen, dass Unternehmen in naher Zukunft vermehrt mit Vorschriften für personenbezogene Daten und KI-Anwendungen konfrontiert werden. Daher ist es wichtig, bereits heute Datenprozesse aufzusetzen, die es Unternehmen ermöglichen, unabhängig von Regulierungen wettbewerbsfähig zu agieren. Dafür braucht es eine Technologie, die den Datenschutz in den Vordergrund stellt. Synthetische Daten können eine Lösung sein, um nicht nur aktuelle Anforderungen zu erfüllen, sondern zukunftsgerichtet zu agieren.

Über den Autor: Omar Ali Fdal ist CEO und Co-Gründer von Statice, einem in Berlin ansässigen, hochmodernen Anbieter von Datenschutz-Technologien für Unternehmen aus der Gesundheits-, Versicherungs- und Finanzbranche. Mit der Statice-Software können diese Unternehmen synthetische Datensätze für die tägliche Anwendung generieren.

(ID:48709417)