Denodo zu Unified Data Warehousing Komplexe Daten erfolgreich verarbeiten

Autor / Redakteur: Martin Hensel / Nico Litzel

Der Spezialist für Datenvirtualisierung und -integration Denodo hat sich mit dem Thema Unified Data Warehousing (DWH) und Data Lakes (DL) befasst. Dieser einheitliche Ansatz ermöglicht die Verarbeitung komplexer Unternehmensdaten.

Firmen zum Thema

Denodo hat das Thema "Unfied DWH/DL" genauer untersucht.
Denodo hat das Thema "Unfied DWH/DL" genauer untersucht.
(Bild: Denodo)

Die bestmögliche Nutzung aller Unternehmensdaten ist ein zentraler Faktor für die Wettbewerbsfähigkeit. Zur Speicherung dieser Informationen kommen häufig Data Warehouses oder Data Lakes zum Einsatz. Angesichts zunehmender Komplexität der Unternehmensdaten, insbesondere durch mehr un- oder semi-strukturierte Informationen, geraten diese Architekturen immer häufiger an ihre Grenzen. Denodo rät daher dazu, per Datenvirtualisierung DWH- und DL-Systeme in einer einheitlichen Plattform („Unified DWH/DL“) miteinander zu verbinden.

Während Data Warehouses auf Analysezwecke spezialisiert sind und dafür Daten aus bestimmten Quellen strukturieren, bereinigen und kuratieren, dienen Data Lakes vor allem zur zentralen Speicherung von Rohdaten, um sie später für Advanced Analytics oder Machine Learning zu nutzen. Beide Architekturen lassen sich On-Premises oder in der Cloud betreiben. Laut dem TDWI-Report „Building the Unified Data Warehouse and Data Lake“ hat etwa die Hälfte der Unternehmen (53 Prozent) ein Data Warehouse On-Premises im Einsatz, während 36 Prozent ein solches oder einen Data Lake in der Cloud nutzen.

Stärken kombiniert

Ein gutes Drittel (36 Prozent) aller Unternehmen nutzt einen Data Lake bereits als Ergänzung zum bestehenden Data Warehouse. Dies ermöglicht beispielsweise die Verarbeitung multistrukturierter Daten oder die Analyse von IoT-Informationen sowie die Einbindung der Ergebnisse in Reports oder Visualisierungen. Den nächsten Schritt bildet laut Denodo das „Unified DWH/DL“: Hierbei verschmelzen die beiden Konzepte auf mehreren Ebenen stark und umfassen funktionale Dienste, die für alle Datentypen, Workloads, Anwendungen und Use Cases identisch sind.

Dieser Ansatz ist auch unter den Bezeichnungen Enterprise Data Architecture, Hybrid Data Architecture, Modern Warehouse Architecture oder Multiplatform Data Architecture bekannt. 84 Prozent der befragten Unternehmen halten das Thema schon jetzt für wichtig oder sehr wichtig. Sie nutzen derartige Systeme zum Beispiel, um Datensilos aufzulösen und eine Single Source of Truth zu schaffen. Dies gestattet unter anderem KI-gestützte Analysen und datenbasierte Erkenntnisse in Echtzeit.

Virtualisierung der bessere Weg

Die Integration kann auf verschiedenen Wegen angegangen werden, wie Denodo betont. Zum einen ist eine physische Konsolidierung durch Verschieben der Daten oder Verlagerung in ein neues Repository möglich. Dies führe laut Denodo aber zu redundanter Datenhaltung und sei aufgrund physischer Datenbewegungen auch wirtschaftlich nicht sinnvoll. Die Virtualisierung mittels einer logischen Datenschicht sei vorteilhafter: Hierbei bleiben die Daten an ihrem Ursprungsort. Ein einheitliches semantisches Modell ermöglicht den Zugriff auf alle Informationen in Data Warehouse oder Data Lake. Der Speicherort der Daten spiele keine Rolle mehr, zudem sei für Zukunfts- und Investitionssicherheit der Dateninfrastruktur gesorgt.

Denodo betont, dass nicht jedes Unternehmen zwangsläufig auf ein „Unified DWH/DL“ umsatteln muss. Allerdings käme man um diesen Schritt kaum herum, sobald bestehende Systeme die Bedürfnisse nicht mehr decken. Wichtig sei dabei, den Prozess nicht überstürzt durchzuführen. Eine schrittweise Umsetzung erlaubt die Optimierung von Abläufen und Daten sowie die Einstellung oder Fortbildung von Mitarbeitern.

(ID:47551101)