Data-Governance-Funktionen ausgebaut Databricks ergänzt Unity Catalog um Data Lineage

Von Martin Hensel |

Anbieter zum Thema

Der Daten- und KI-Spezialist Databricks hat Data Lineage für den Unity Catalog angekündigt. Nutzer erhalten dadurch mehr Kontrolle darüber, wie Daten in ihrem Data Lakehouse verwendet werden. Zudem sorgt Data Lineage für ein transparenteres System.

Mit Data Lineage für den Unity Catalog baut Databricks sein Data Lakehouse weiter aus.
Mit Data Lineage für den Unity Catalog baut Databricks sein Data Lakehouse weiter aus.
(Bild: Databricks)

Mit Data Lineage für den Unity Catalog erweitert Databricks die Data-Governance-Funktionen seines Data Lakehouses deutlich. Anwender können über die neue Funktion unter anderem feststellen, woher die Daten in ihrem Lakehouse stammen, wer sie wann erstellt hat, wie sie im Laufe der Zeit verändert wurden und wie sie derzeit zum Einsatz kommen. Die Erweiterung ist bereits als Vorschau auf AWS und Microsoft Azure verfügbar.

Mehr Übersicht, höhere Datenqualität

Data Lineage ist unverzichtbar, um das Vertrauen in die Daten zu stärken und Risiken zu bewerten. Mit der jetzt vorgestellten Funktion können Teams alle nachgelagerten Anwender sehen, die von Datenänderungen betroffen sind. Dies schließt unter anderem Anwendungen, Dashboards, Modelle für maschinelles Lernen und Datensätze mit ein. Der Schweregrad der Auswirkungen von Änderungen lässt sich einfach erkennen und Teams können die betroffenen Anwender informieren.

Data Lineage ermöglicht Datennutzern wie etwa Data Scientists, Data Engineers und Analysten eine kontextbewusste Durchführung von Analysen und damit qualitativ bessere Ergebnisse. Zudem können Data Stewards sehen, auf welche Datensätze nicht mehr zugegriffen wird oder welche veraltet sind. Nicht mehr benötigte Daten lassen sich somit entfernen, was das Fehlerrisiko reduziert und die Datenqualität erhöht. Unternehmen erhalten einen vollständigen Überblick über den Datenlebenszyklus. Zudem hilft Data Lineage bei der Einhaltung von Compliance-Vorgaben wie zum Beispiel der EU-Datenschutz-Grundverordnung (DSGVO) oder dem Health Insurance Portability and Accountability Act (HIPAA).

Wichtiger Erfolgsfaktor

„Governance-Funktionen wie Data Lineage sind von entscheidender Bedeutung für den Aufbau der branchenweit robustesten Lakehouse-Plattform“, erklärt Matei Zaharia, Mitbegründer und Chief Technologist von Databricks. Ohne eine gute Datenhistorie sei es schwierig, Geschäfts- und Prüfprozesse nachzuvollziehen, die datengesteuerte Unternehmen für ihren Erfolg benötigen.

„Unser Ziel ist es, sicherzustellen, dass sich unsere Kunden auf Erkenntnisse konzentrieren können und durch eine einheitliche, transparente Sicht auf ihr gesamtes Datenökosystem zu aktiven Management-Praktiken übergehen“, so Zaharia.

(ID:48440317)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung