31.01.2025
Datenqualität als Schlüssel zu erfolgreicher KI
Warum sind saubere Daten besonders für Projekte aus dem Bereich Künstliche Intelligenz ein Gamechanger? Welche Risiken können durch mangelnde Datenqualität entstehen? Und warum sind Use Cases für die Entscheidung über die benötigte Datenqualität absolut entscheidend? Diese Fragen beantwortet Dr. Johannes Kutterer, leitender Lösungsarchitekt und stellvertretender Leiter Beratung und Lösungsentwicklung bei Disy.
Warum ist die Qualität von Daten so entscheidend für den Erfolg von KI-Anwendungen?
Dr. Johannes Kutterer: Ganz einfach: Ohne gute Daten, keine guten Ergebnisse. Daten sind das Fundament jeder KI-Anwendung. Ein Modell kann nur so gut sein wie die Daten, mit denen es trainiert wird. Wenn die Daten lückenhaft, fehlerhaft oder verzerrt sind, liefert die KI unzuverlässige Vorhersagen. Das kann gerade in sensiblen Bereichen wie der öffentlichen Verwaltung oder im Finanzwesen schwerwiegende Folgen haben. Denken wir an eine KI, die Anträge auf Fördermittel automatisiert bewertet – fehlerhafte Daten könnten hier zu falschen Ablehnungen führen. Ähnlich kritisch ist es im Bereich der Versicherungsbranche: Falsche Risikoeinschätzungen können erhebliche finanzielle Auswirkungen haben. Deshalb ist Datenqualität nicht nur eine technische Herausforderung, sondern auch eine strategische Aufgabe. Organisationen – ob öffentlich oder privat – müssen die Datenbasis genauso ernst nehmen wie die Entwicklung der KI-Modelle selbst.
Was sind die größten Risiken, wenn die Datenqualität nicht gewährleistet ist?
Dr. Johannes Kutterer: Die Liste der Risiken ist lang. Zum einen entstehen Fehlentscheidungen, weil die KI auf Basis falscher Annahmen agiert. Das führt zu falschen Vorhersagen und unzuverlässigen Empfehlungen – und das kann teuer werden. Ein weiteres Risiko ist die sogenannte Algorithmic Bias: Verzerrungen in den Daten können zu diskriminierenden Entscheidungen führen, etwa bei Kreditvergaben oder der Bearbeitung von Bürgeranträgen. Die ghanaisch-amerikanische Informatikerin Joy Buolamwini hat gezeigt, wie drastisch sich solche Verzerrungen auswirken können. Ein Gesichtserkennungsalgorithmus konnte ihr dunkles Gesicht nicht erkennen, da der zugrunde liegende Datensatz vor allem weiße, männliche Gesichter enthielt. Solche Fehler können Vertrauen in die Technologie zerstören und hohe Korrekturkosten verursachen. Deshalb ist es entscheidend, frühzeitig auf Responsible AI zu setzen und die Datenbasis kritisch zu prüfen.
Wie wichtig sind spezifische Use Cases für die Entscheidung über die benötigte Datenqualität?
Dr. Johannes Kutterer: Spezifische Use Cases sind absolut entscheidend! Denn jedes Projekt hat andere Anforderungen an die Datenqualität. In der öffentlichen Verwaltung könnte eine KI etwa bei der Bearbeitung von Baubewilligungen unterstützen, indem sie Fachdaten mit Verwaltungsvorschriften abgleicht – zum Beispiel bei Themen wie Bombenluftbildabgleichen oder Altlastbewertungen. In der Privatwirtschaft sind die Anforderungen ganz anders: Ein Modell für Produktempfehlungen im E-Commerce braucht vor allem aktuelle Daten zu Kaufverhalten und Nutzerinteressen. Deshalb ist es entscheidend, den Use Case genau zu verstehen, bevor man sich mit der Datenqualität beschäftigt. Andernfalls riskiert man, unnötig viel Aufwand in die Datenaufbereitung zu stecken – oder wichtige Aspekte zu übersehen. Eine gezielte Fokussierung hilft, Ressourcen zu sparen und erfolgreichere Ergebnisse zu erzielen.
Wie kann eine Organisation die Datenqualität langfristig sicherstellen?
Dr. Johannes Kutterer: Hier geht es um einen Mix aus Technik, Prozessen und Kultur. Zuerst braucht es eine solide Data Governance. Das bedeutet: klare Regeln, wer für welche Daten verantwortlich ist und wie diese verwaltet werden. Zudem helfen Tools zur automatisierten Datenprüfung, die Fehler zuverlässig erkennen und melden. In der öffentlichen Verwaltung könnten solche Tools beispielsweise dazu genutzt werden, Inhalte mit Daten aus anderen Fachverfahren abzugleichen, um Fehler zu entdecken und Konsistenz sicherzustellen. In der Privatwirtschaft können sie beispielsweise bei der Überprüfung von Kundendaten in CRM-Systemen unterstützen. Wenn Mitarbeitende lernen, wie wichtig z. B. die Richtigkeit von Eingabedaten ist, lassen sich Fehlerquellen an der Basis vermeiden. Und zu guter Letzt: Feedback-Schleifen einbauen! Die Ergebnisse der KI-Modelle können genutzt werden, um die Datenbasis kontinuierlich zu verbessern. Es ist ein Kreislauf, der nie aufhört – und das ist auch gut so.
Haben sie einen Tipp für Organisationen, die mit der Optimierung der Datenqualität starten wollen?
Dr. Johannes Kutterer: Mein wichtigster Tipp: Klein anfangen, groß denken. Setzt Pilotprojekte auf, bevor ihr alles auf eine große Lösung umstellt. Testet in einem kleinen Rahmen, wie gut die Datenqualität für einen konkreten Use Case ausreicht. Im öffentlichen Sektor könnte das ein Pilotprojekt zur automatisierten Antragserkennung in einer Fachabteilung sein. In der Privatwirtschaft wäre ein Projekt denkbar, bei dem die Kundensegmentierung optimiert wird, um zielgerichtetere Marketingkampagnen zu fahren. So erkennt ihr früh Schwachstellen und könnt nachjustieren. Das vermeidet teure Nachbesserungen. Und noch etwas: Fehler sind völlig normal. Datenqualität ist keine „Einmal-erledigt-Aufgabe“, sondern ein kontinuierlicher Prozess. Wichtig ist, dass Organisationen aus Fehlern lernen und ihre Strategien schrittweise verbessern. Wer das verinnerlicht, wird langfristig profitieren.
Fazit: Warum sich der Aufwand für Datenqualität lohnt
Saubere Daten sind das A und O für den Erfolg von KI-Anwendungen – sowohl in der öffentlichen Verwaltung als auch in der Privatwirtschaft. Organisationen, die sich dieser Aufgabe stellen, vermeiden teure Fehlentscheidungen, reduzieren Risiken und stärken das Vertrauen in ihre KI-Lösungen. Mit einem klaren Fokus auf den Use Case, einer etablierten Data Governance und kontinuierlichen Feedback-Schleifen können Organisationen die Datenbasis stetig verbessern. Der Lohn dafür: bessere Vorhersagen, höhere Effizienz und – ganz wichtig – das Vertrauen der Nutzenden.
Wollen Sie mehr zum Thema Datenqualität und KI erfahren?
- Jetzt Kontakt aufnehmen und praxisnahe Einblicke von unseren Expert:innen erhalten.