ETL-Framework vorgestellt Databricks startet Delta Live Tables

Von Martin Hensel

Der Daten- und KI-Spezialist Databricks bietet ab sofort Delta Live Tables (DLT) an. Dabei handelt es sich um ein ETL-Framework („Extract, Transform, Load“), das sowohl die Infrastruktur automatisch verwaltet als auch Software-Engineering-Praktiken in die Datentechnik einbringt.

Anbieter zum Thema

Databricks DLT soll Data Engineers und Analysten die Arbeit erleichtern.
Databricks DLT soll Data Engineers und Analysten die Arbeit erleichtern.
(Bild: Screenshot / Databricks)

DLT nutzt laut Databricks einen einfachen deklarativen Ansatz für den Aufbau zuverlässiger Datenpipelines und die automatische Verwaltung der Dateninfrastruktur in großem Maßstab. Die Umwandlung von SQL-Abfragen in produktive ETL-Pipelines erfordert meist langwierige und komplizierte operative Arbeit. Dies will Databricks bei DLT durch den Einsatz moderner Software-Engineering-Praktiken zur Automatisierung der zeitaufwendigsten Vorgänge reduzieren. Data Engineers und Data Analysts sollen sich dadurch mehr auf die Bereitstellung von Daten konzentrieren können, anstatt Zeit für Betrieb und Wartung der Pipelines aufwenden zu müssen.

Mehr Zeit für wichtige Aufgaben

Mit DLT können Dateningenieure die Ergebnisse von Datentransformationen einfach beschreiben. Die Databricks-Lösung erfasst live die Abhängigkeiten der gesamten Datenpipeline und automatisiert nahezu alle komplexen Vorgänge. Laut dem Hersteller können Data Engineers ihre Daten dadurch wie Code behandeln und somit Best Practices aus dem Software-Engineering darauf anwenden. Dazu zählen etwa Tests, Fehlerbehandlung, Überwachung und Dokumentation. Auf diese Weise lassen sich zuverlässige Pipeline in größerem Umfang bereitstellen. DLT unterstützt Python und SQL. Die Lösung ist zudem auf die Arbeit mit Streaming- und Batch-Workloads ausgelegt.

„Die Stärke von DLT liegt in etwas, das sonst niemand kann - moderne Software-Engineering-Praktiken und automatische Verwaltung der Infrastruktur zu kombinieren. Es ist eine bahnbrechende Technologie, die es Data Engineers und -analysten ermöglicht, produktiver denn je zu sein“, meint Ali Ghodsi, CEO und Mitbegründer von Databricks. „DLT unterstützt jede Art von Daten-Workload mit einer einzigen API und macht fortgeschrittene Data-Engineering-Kenntnisse überflüssig“, ergänzt er.

(ID:48191836)