Hybride Datenhaltung in Datenbanken und in Hadoop

Auch ein Enterprise Data Warehouse lässt sich optimieren

Seite: 3/3

Firmen zum Thema

Keine Einbahnstraßen

Hochentwickelte visuelle Integrationswerkzeuge erlauben zum Beispiel die Auslagerung der Daten nach Hadoop ohne Programmierung oder die Verwendung von Legacy-Skripts aber auch ohne von ETL-Produktbeschränkungen abhängig zu sein. Wichtig ist dabei, dass diese Integrationswerkzeuge einen bidirektionalen Zugriff ermöglichen, so dass auch Daten von Hadoop ins EDW geladen werden können. Dieses Szenario ist besonders deshalb interessant, weil Hadoop es ermöglicht, auch unstrukturierte oder andere neue Datentypen in Mengen aufzunehmen, die nicht oder nur schwierig in klassische relationale EDW abgelegt werden können, wie Webdaten, Maschinendaten oder Sensordaten.

Oftmals sind auch analytische Datenbanken Teil dieses neuen hybriden Systems. Diese abfrageorientierten Datenbanken sind für das schnelle Verarbeiten großer Datenmengen für analytische Anwendungen konzipiert.

So sieht das Ganze aus von der architektonischen Ebene aus.
So sieht das Ganze aus von der architektonischen Ebene aus.
(Bild: Pentaho)

Dazu ein Praxisbeispiel: Ein Unternehmen im Bereich Netzwerkspeicher lagert eine sehr große Menge an Geräteleistungsdaten in ein Hadoop-Cluster aus, um operative Engpässe zu vermeiden und die Servicelevel-Vereinbarungen zu erfüllen. Die Daten werden regulär in Hadoop eingespeist und verarbeitet und anschließend an RDMS und Data Marts verteilt.

Die Vorteile für das Unternehmen sind Einsparungen bei den Datenverwaltungs- und Speicherkosten, kostengünstige Datenskalierbarkeit und erhöhte Leistung bei der Erfüllung von Servicelevel.

Der Autor:

Davy Nys ist Vice President, zuständig für die Regionen Europa, Naher Osten und Afrika sowie Asien und dem Pazifischen Raum bei Pentaho.

(ID:42920356)