Kostengünstiger De-facto-Standard für das Datensammeln und -auswerten

Hadoop als Big-Data-Betriebssystem überzeugt Datenanalysten

Seite: 3/3

Firmen zum Thema

Mehr als Daten-Management

Allerdings beginnen die meisten Unternehmen heute nicht auf einer „grünen Wiese“, wenn es um Analytics geht. In der Regel sind bereits mehr oder weniger ausgebaute Infrastrukturen vorhanden – und nicht zuletzt auch das Know-how der Anwender, diese zu nutzen.

Interessant ist Hadoop deshalb vor allem dann, wenn es in diese Strukturen eingebunden werden kann und deren Möglichkeiten erweitert. Idealerweise ist Hadoop für den Endanwender weitgehend transparent und verlangt kein Umlernen.

Die Integration von SAS-Werkzeugen und Hadoop
Die Integration von SAS-Werkzeugen und Hadoop
(Bild: SAS Institute)

Ein erheblicher Teil des Mehrwertes von Hadoop im Unternehmensumfeld steckt also in der Integration in die Unternehmens-IT. In Verbindung mit Big-Data-Analytics-Lösungen wie denen von SAS erhalten Unternehmen eine Analytics-Plattform, mit der sich Massendaten in Echtzeit auswerten lassen.

Insgesamt gibt es drei Einsatzszenarien für Hadoop:

  • 1. Daten-Management
  • 2. In-Database Processing
  • 3. In-Memory-Technologie/High-Performance Analytics

Über das klassische Data Management hinaus (sei es SQL-basiert oder unter Verwendung von Hadoop-eigenen Skriptsprachen wie „Pig“) kann Hadoop auch für weitere Arten der Datenverarbeitung genutzt werden. Beim In-Database Processing wird (analytische) SAS Funktionalität wie beispielsweise Scoring-Läufe, die die Eintrittswahrscheinlichkeit von Ereignissen wie Kündigungen, Betrugsfällen oder Materialfehlern vorhersagen, direkt im Hadoop-Cluster ausgeführt (in-database = „in-hadoop“). Offensichtlicher Nutzen dieses Vorgehens: der Verzicht auf unnötige Datenbewegungen, die im Big-Data-Umfeld besonders kritisch zu betrachten sind.

Schneller und schneller

Ein weiteres Einsatzszenario zeichnet sich im Rahmen von High-Performance Analytics ab, bei der Daten sehr performant aus Hadoop gezogen und in den LASR In-Memory-Server von SAS abgelegt werden können. Das Besondere: Die Daten können parallelisiert aus Hadoop gelesen und wieder zurückgeschrieben werden, wodurch auch sehr große Datenmengen in kürzester Zeit für den Zugriff bereitstehen. Diese neuen Auswertungsmöglichkeiten generieren erst einen unternehmerischen Wert aus den Hadoop-Daten.

Der Trend geht dahin, dass Hadoop zunehmend in die IT-Landschaft integriert wird. Allerdings sind deutsche Unternehmen hier noch wesentlich zögerlicher als Unternehmen in den USA, wo große Hadoop-Cluster im Produktivbetrieb bereits alltäglich sind.

So kommt am Thema Hadoop zwar niemand vorbei, jedoch gibt es in Deutschland und Europa noch kaum Hadoop-spezifisches Know-how. Vorreiter bei der Einführung von Hadoop sind die Internet-Unternehmen. Aber das Thema kommt langsam auch im Handel, in der Telekommunikationsbranche, in der Industrie oder sogar in der Versicherungsbranche an.

Weg mit den Wissenslücken!

Wesentliche Voraussetzung für den erfolgreichen Einsatz der neuen Technologie ist die Bereitschaft, die IT-Strategie auf Hadoop abzustimmen. SAS hilft Unternehmen dabei, zum Beispiel mit Lösungen wie SAS In-Memory Statistics for Hadoop und über Partnerschaften mit Hortonworks und Cloudera.

Durch die Integration mit den SAS Lösungen können Unternehmen auch für Hadoop den gesamten Analytics-Lifecycle abdecken – beginnend beim vorbereitenden Datenmanagement über Exploration und Visualisierung der Daten bis hin zur Generierung von Erklärungsmodellen und Anwendung der gewonnenen Erkenntnisse.

Hadoop hat sich bereits als De-facto-Standard von „Big-Data“-Anwendungen etabliert, und die Weiterentwicklung des Open-Source-getriebenen „Big-Data-Betriebssystems“ erfolgt in atemberaubender Geschwindigkeit. Unternehmen, die diese Entwicklung nicht frühzeitig für sich nutzen, riskieren nach Ansicht von Experten, Wettbewerbsvorteile ungenutzt zu lassen, die bereits in naher Zukunft einen entscheidenden Unterschied machen können.

Der Autor:

Hans-Joachim Edert ist Senior Solutions Architect bei SAS Deutschland.

(ID:42820062)