Hybride Datenhaltung in Datenbanken und in Hadoop

Auch ein Enterprise Data Warehouse lässt sich optimieren

Seite: 2/3

Firmen zum Thema

Ein zweistufiges Konzept

Zugleich lassen sich EDW-Kosten durch verminderten Bedarf an Data Warehouse-Infrastruktur reduzieren und Verwaltungskosten durch den Einsatz von Datenspeichern mit niedriger Latenz sparen. Hierfür werden weniger genutzte Daten nach Hadoop ausgelagert und die Leistung wird durch das Verschieben von Datentransformationen nach Hadoop erhöht.

Mithilfe von Hadoop lassen selbst vorhandene Data-Warehouse-Strukturen besser nutzen.
Mithilfe von Hadoop lassen selbst vorhandene Data-Warehouse-Strukturen besser nutzen.
(Bild: Pentaho)

Und so sieht die Optimierung des EDW auf architektonischen Ebene aus: Auf der einen Seite gibt es die traditionellen Datenquellen wie CRM-, ERP- oder andere Alt-Systeme, die via Extract Transform Load (ETL) Prozess ins das EDW geladen werden. Dabei stellt das EDW eine zuverlässige und gut durchdachte Produktionsumgebung dar, der als Datenquelle vertraut wird, auch weil die Anwendung von Datenqualität und Data Governance in diesem Umfeld die Regel ist.

Die Auslagerung von Daten aus dem EDW in ein Hadoop Cluster, gestaltet sich mit Hilfe moderner Datenintegrationswerkzeuge, die native Konnektivität für Hadoop und seine Distributionen bieten und die Orchestrierung des Prozesses visuell ähnlich wie in einer klassischen ETL-Umgebung darstellen einfacher als vielleicht von einer komplexen Technologie wie Hadoop erwartet wird.

(ID:42920356)