Definition

Was ist Data Quality?

| Autor / Redakteur: Stefan Luber / Nico Litzel

(Bild: © aga7ta - stock.adobe.com)

Die Data Quality bestimmt, wie gut sich Datenbestände für vorgesehene Aufgaben eignen. Das können beispielsweise Anwendungen aus dem Business-Intelligence-Umfeld sein. Es existieren zahlreiche Kriterien, anhand derer sich die Data Quality bewerten lässt.

Data Quality, im Deutschen Datenqualität, gibt Auskunft darüber, wie gut sich vorhandene Daten für bestimmte Anwendungen oder Aufgaben eignen. Anhand von Kriterien lässt sich die Data Quality eines Datenbestands bestimmen. Neben der Korrektheit und Verlässlichkeit der Daten spielen zahlreiche weitere Kriterien wie die Relevanz und Verfügbarkeit eine wichtige Rolle für die Datenqualität. Für ein Unternehmen kann die Data Quality entscheidend für den geschäftlichen Erfolg sein. Nur wenn die Datenqualität gegeben ist, lassen sich operative Prozess zuverlässig steuern, relevante Berichte erstellen oder Business-Analytics- und Business-Intelligence-Anwendungen effizient ausführen.

Durch eine mangelnde Datenqualität oder fehlerhafte Datenbestände können einem Unternehmen unter Umständen erhebliche Kosten entstehen. Beispielsweise verursachen Adressdubletten einen erhöhten finanziellen und zeitlichen Aufwand beim Versand von Mailings. Schon bei der Erhebung der Daten kann sich die Datenqualität aufgrund verschiedener Datenquellen stark unterscheiden. Aber auch die Speicherung, Verwaltung und das Bereitstellen von Datensätzen hat Einfluss auf die Data Quality.

Im Unternehmensbereich werden zahlreiche Maßnahmen durchgeführt, die die Qualität und Zuverlässigkeit der Daten sichern. Je höher die Data Quality, desto besser lassen sich beispielsweise Marketingaktionen an die Erwartungshaltung potenzieller Kunden anpassen, kritische Unternehmensentscheidungen treffen oder maßgeschneiderte Dienstleistungen erbringen.

Die wichtigsten Kriterien zur Bewertung der Data Quality

Es existieren zahlreiche Kriterien, mit deren Hilfe sich die Qualität von Datenbeständen bewerten lassen. Sie geben Auskunft darüber, wie gut sich Daten für definierte Anwendungen und Aufgaben eignen. Diese Bewertungskriterien sind unter anderem:

  • Die Exaktheit der Daten,
  • die Vollständigkeit der Daten,
  • die Relevanz der Daten für bestimmte Aufgaben und Anwendungen,
  • die Aktualität der Daten,
  • die Zuverlässigkeit der Daten,
  • die Konsistenz der Daten über die verschiedenen Systeme und Quellen hinweg sowie
  • die Verfügbarkeit und Zugänglichkeit der Daten.

Maßnahmen zur Erreichung einer hohen Datenqualität

Um eine hohe Data Quality sicherzustellen, ist es erforderlich, verschiedene Maßnahmen durchzuführen. Diese Maßnahmen umfassen initiale, einmalig durchzuführende Aufgaben aber auch kontinuierliche Tätigkeiten und Prozeduren. Ist ein hoher Level an Datenqualität erreicht, gilt es diesen zu bewahren und die Datenbestände regelmäßig zu analysieren und zu bereinigen. Die Bereinigung der Daten umfasst zum Beispiel das Löschen von Dubletten, die Aktualisierung der Daten oder die Standardisierung der vorhandenen Datenbestände. Insgesamt sind die Maßnahmen in drei grundlegende Schritte unterteilbar. Diese drei Schritte sind:

  • Die Analyse der Daten (Data Profiling),
  • die Bereinigung der Daten (Data Cleaning) und
  • das Monitoring der Daten (Data Monitoring).

Die Datenanalyse erkennt Fehler und Widersprüche in den Beständen. Dazu zählen Inkonsistenzen der Daten und fehlerhafte Daten. Aufgrund der aus der Datenanalyse gewonnenen Erkenntnisse, werden die weiteren Maßnahmen festgelegt, die die Qualität des Datenbestandes verbessern.

Der Prozess der Datenbereinigung behebt die bei der Fehleranalyse erkannten Probleme. Es kommen für die verschiedenen Fehlerarten unterschiedliche Verfahren und Algorithmen zur Bereinigung zum Einsatz. Durch einen hohen Automatisierungsgrad ist der manuelle Aufwand für das Data Cleaning minimierbar. Während der Datenbereinigung werden Dubletten beseitigt, Datentypen korrigiert oder lückenhafte Datensätze vervollständigt.

Das Data Monitoring schließlich prüft in regelmäßigen Abständen die Qualität der vorliegenden Daten. Ergibt sich eine Änderung der Data Quality, informiert das Monitoring und ermöglicht das Einleiten erneuter Analyse- oder Bereinigungsmaßnahmen. Nur wenn die Data Quality kontinuierlich überwacht und die Ergebnisse mitgeteilt werden, lässt sich die Qualität der Datenbestände über größere Zeiträume bewahren. Fehlt das Monitoring, sinkt der erreichte Qualitätslevel über die Zeit kontinuierlich ab. Über Trendreports und Alarmierungen des Data Monitorings wird die Veränderung der Qualitätsniveaus nachverfolgbar.

Die Datenalterung und ihre Auswirkungen auf die Data Quality

Die für bestimmte Zwecke erhobenen Daten unterliegen einer Datenalterung. Werden Daten über einen längeren Zeitraum nicht aktualisiert, verschlechtert sich ihre Data Quality aufgrund der Datenalterung kontinuierlich. Beispielsweise können sich Adressen von Kunden oder Lieferanten, Produkteigenschaften und Produktnamen, Preise von Dienstleistungen und Produkten oder Rechtsformen von Unternehmen ändern. Je mehr Zeit verstreicht, desto wahrscheinlicher ist es, dass der vorliegende Datenbestand von solchen Änderungen betroffen ist. Es entsteht ohne Gegenmaßnahmen alleine durch die Alterung eine schleichende Verschlechterung der Datenqualität. Das Data Monitoring stellt eine entscheidende Maßnahme zur Erhaltung oder Wiederherstellung der von der Datenalterung beeinflussten Data Quality dar.

Unterstützende Software für die Sicherstellung der Data Quality

Um den manuellen Aufwand im Unternehmen für die Sicherstellung einer hohen Data Quality zu minimieren, existieren am Markt zahlreiche Anwendungen. Sie automatisieren Datenanalyse-, Datenbereinigungs- und Datenüberwachungsvorgänge mithilfe intelligenter, zum Teil selbstlernender Algorithmen. Die riesigen Datenbestände im Big-Data-Umfeld sind nur mit solch unterstützender Software auf einem hohen Qualitätslevel zu halten.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Aktuelle Beiträge zu diesem Thema

RPA – Vorurteile sind fehl am Platz

Signavio gibt Rat

RPA – Vorurteile sind fehl am Platz

Der Business-Transformation-Spezialist Signavio sieht eine unbegründete Angst vor dem Einsatz von Robotic Process Automation (RPA) in deutschen Unternehmen. Dabei führe ein methodischer Ansatz fast immer zu einer erfolgreichen Implementierung. lesen

Auf dem Weg zum Daten-getriebenen Unternehmen zählt der Mensch

Kommentar von Horia Selegean, BT

Auf dem Weg zum Daten-getriebenen Unternehmen zählt der Mensch

Wie oft hören wir von Managern Sätze wie „Daten sind das Lebenselixier unseres Unternehmens“ oder „Wir sind ein Daten-getriebenes Unternehmen“? Der Gedanke ist gut, aber sehr wahrscheinlich mehr Wunschdenken als Realität, wenn man nicht gerade ein neues Unternehmen gegründet hat und ein „Digital Native“ ist. lesen

Data-Science-Projekte – so starten Sie richtig

Kommentar von Björn Heinen, Inform GmbH

Data-Science-Projekte – so starten Sie richtig

Nie war das weltweite Datenvolumen größer als heute. Vor allem in Unternehmen sammeln sich enorme Mengen an Informationen, die großes Optimierungspotenzial versprechen – doch das will erst einmal erschlossen werden. Data Science bietet strategische Ansätze, sich im Datendschungel zurechtzufinden. Doch auch bei Data-Science-Projekten gilt: Es gibt richtig und falsch. lesen

Datenmanagement wird immer wichtiger

Kommentar von Jean-Michel Franco, Talend

Datenmanagement wird immer wichtiger

Im Zeitalter von Internet, Social Media und verfälschten Nachrichten befindet sich die Gesellschaft in einer Vertrauenskrise. Verbraucher sind skeptisch gegenüber dem, was sie lesen, hören und sehen. Sogenannte alternative Fakten verwischen die Wahrnehmung dessen, was real und was fiktiv ist. lesen

Tableau veröffentlicht Explain Data, Catalog und weitere Neuheiten

Analytics-Plattform erweitert

Tableau veröffentlicht Explain Data, Catalog und weitere Neuheiten

Tableau Software hat seine Analytics-Plattform in Version 2019.3 um einige Neuheiten erweitert. Dazu zählen Explain Data für statistische Analysen, Catalog zur Datenverwaltung sowie ein Add-on für das Server-Management. lesen

5 Empfehlungen für KI-Projekte

Verschenktes Potenzial

5 Empfehlungen für KI-Projekte

Algorithmen, Roboter und digitale Assistenten haben in deutschen Unternehmen Einzug gehalten: Gut 40 Prozent der Betriebe haben schon mit Künstlicher Intelligenz (KI) gearbeitet, 88 Prozent planen dies in den kommenden zwölf Monaten. Doch die Unternehmen setzen KI vorwiegend zur Prozessoptimierung ein – und schöpfen dadurch ihr Potenzial nicht umfassend aus, so die These von Johannes Wagmüller, Netapp. lesen

5 Empfehlungen für KI-Projekte

Verschenktes Potenzial

5 Empfehlungen für KI-Projekte

Algorithmen, Roboter und digitale Assistenten haben in deutschen Unternehmen Einzug gehalten: Gut 40 Prozent der Betriebe haben schon mit Künstlicher Intelligenz (KI) gearbeitet, 88 Prozent planen dies in den kommenden zwölf Monaten. Doch die Unternehmen setzen KI vorwiegend zur Prozessoptimierung ein – und schöpfen dadurch ihr Potenzial nicht umfassend aus, so die These von Johannes Wagmüller, Netapp. lesen

Wie Datenanalyse im Unternehmen umgesetzt werden kann

Data Analytics

Wie Datenanalyse im Unternehmen umgesetzt werden kann

Potenziale aus Daten zu heben, steht aktuell im Fokus vieler Unternehmen – gleichzeitig stehen sie vor dem Frage, wie Datenanalyse im eigenen Unternehmen umgesetzt werden kann. Ein Überblick, was beachtet werden muss. lesen

Vier Schritte, um Data Lakes zu strukturieren

Kommentar von Oliver Schröder, Informatica

Vier Schritte, um Data Lakes zu strukturieren

IT-Mitarbeiter stehen vor einer Reihe von Herausforderungen. Sie müssen nicht nur immer mehr Services anbieten, sondern auch neue Technologien implementieren. Darüber hinaus müssen sie sich jetzt auch noch des Themas Kundenzufriedenheit annehmen. Denn unzufriedene Kunden beeinflussen das gesamte Unternehmen. lesen

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 44931575 / Definitionen)