SAP HANA Vora SAP stellt Query-Engine für Hadoop/Spark vor
Anbieter zum Thema
SAP hat mit SAP HANA Vora eine In-Memory-Lösung für Hadoop und Spark vorgestellt, die sowohl SAP-Kunden als auch Unternehmen, die keine SAP-Systeme verwenden, nutzen können, um Big Data rasch auszuwerten. Mit der Query Engine will SAP die Echtzeitverarbeitung von Daten aller Art für Geschäftsprozesse unterstützen.

Der Name „Vora“ steht nach SAP-Angaben für „voracious“, was soviel wie „gefräßig“ bedeutet. Das passt zur Aufgabe von Vora, das ganze Datenozeane anzapfen soll. „SAP HANA Vora ist eine neue Query-Engine auf Basis von In-Memory-Technologie, die das Datenverarbeitungs-Framework Apache Spark nutzt und erweitert und dadurch umfassende, interaktive Analysen in Hadoop ermöglicht“, erläutert Rolf Schumann, SAPs CTO für die Region Middle and Eastern Europe (MEE). Dabei würden alle gängigen Hadoop-Distributionen unterstützt. Hortonworks sei per Default voreingestellt.
„Vora ist nutzbar sowohl von SAP-Kunden als auch von Firmen, die keine SAP-Systeme verwenden, und richtet sich an Unternehmen, die bereits Spark/Hadoop einsetzen“, erläutert Frank Niemann, Analyst beim Beratungshaus PAC. Vora setzt als Technologie auf Spark/Hadoop auf, ein SAP-HANA-System ist dabei nicht erforderlich.
OLAP-ähnliche Analysen
Mit der Query-Engine SAP HANA Vora sollen laut Schumann OLAP-ähnliche Analysen realisierbar sein, bei denen auch die Geschäftssemantik von Daten aus dem Hadoop-Umfeld berücksichtigt wird. Diese Geschäftssemantik ist in den Metadaten gespeichert, die auch das Datenmodell einer solchen Analyse-Landschaft beschreiben. Daher erhalten sowohl Data Scientists, DBAs als auch Entwickler Zugriff auf Daten und Unternehmensdaten lassen sich leichter mit Hadoop-Daten verknüpfen.
„Zu unseren wesentlichen Anforderungen gehört eine bessere Analyse großer Datenmengen", sagt Aziz Safa, Manager für IT Enterprise Applications and Application Strategy beim SAP-Partner Intel. „Doch diese Daten in Hadoop nach Kontextinformationen zu durchsuchen, ist eine ziemliche Herausforderung. Mit SAP HANA Vora sind wir in der Lage, die OLAP-Verarbeitung dieser riesigen Hadoop-Datenmengen direkt im Arbeitsspeicher durchzuführen. So können wir Kontextinformationen auslesen und diese wertvollen Erkenntnisse dann den Anwendern im Unternehmen bereitstellen. Der Kontext befindet sich in den Metadaten.“
Spark/Hadoop-Daten für die SAP Business Suite
„Nutzer von BI-Werkzeugen wie SAP Lumira können über Vora auf die über Spark/Hadoop bereitgestellten Daten zugreifen", erläutert Lars Iffert vom BARC-Institut. „Zudem kann Vora auch mit einer bestehenden HANA-Umgebung integriert werden, sodass auch die über Spark/Hadoop bereitgestellten Daten in der SAP Business Suite oder S/4 HANA genutzt werden können.“ Vora könne dabei auf der HANA Cloud Platform laufen sowie on-premise.
„SAP HANA Vora ist eine Technologie, keine spezifische Anwendung für einen Fachbereich“, gibt Frank Niemann, Analyst bei Pierre Audoin Consultants (PAC), zu bedenken. „Damit Fachbereiche profitieren, muss man für sie sinnvolle Lösungen bauen. Praktisch jeder Fachbereich kann also aus Vora einen Nutzen ziehen. Beispielsweise können Maschinen- und Sensordaten, die das Unternehmen kostengünstig auf einem Hadoop-Cluster ablegt, mittels Vora in der SAP-Umgebung – zum Beispiel in Form von Lumira-Berichten und -Analysen – ausgewertet werden.“
BARC-Analyst Iffert malt folgendes Szenario: „Entwickler, die mit der HANA Cloud Platform arbeiten, können in der Entwicklung ihrer Anwendungen bei Nutzung von SAP Vora die Spark/Hadoop-Technologie besser ausnutzen: SAP verspricht, dass Entwickler mittels Vora Daten, die sich auf Spark/Hadoop-Clustern befinden, einfacher ansteuern lassen.“ Zudem biete Vora Funktionen für eine bessere Unterstützung von Analyse-, OLAP- und Drill-Down-Funktionen auf den in Spark/Hadoop gehaltenen Daten gegenüber Standard-Spark. „Davon profitiert der Entwickler, der HANA und Spark/Hadoop gemeinsam nutzen will.“ Nach Angaben von Schumann unterstützt Vora die Abfragesprache SQL.
Einsatzgebiete
Unternehmen aus Branchen wie dem Finanzdienstleistungssektor, der Telekommunikation, dem Gesundheitswesen und der Fertigungsindustrie seien laut Schumann auf die interaktive Analyse großer Datenmengen im Kontext der jeweiligen Geschäftsprozesse angewiesen. Ihnen soll SAP HANA Vora unter anderem folgende Vorteile bringen bzw. sich für folgende Einsatzgebiete eignen:
- 1. Risikominimierung und Betrugsprävention durch das Aufdecken bislang unerkannter Unregelmäßigkeiten in Finanztransaktionen und historischen Kundendaten,
- 2. Bandbreitenoptimierung in der Telekommunikation durch Analyse von Datenverkehrsmustern zur Vermeidung von Netzwerkengpässen und Verbesserung der Servicequalität,
- 3. Vorbeugende Instandhaltung und Verbesserung der Prozesse für den Produktrückruf durch gemeinsame Analyse von Stücklisten, Datensätzen aus dem Service und Sensordaten,
- 4. Krebsforschung und -behandlung,
- 5. Virtuelles (Solar-)Kraftwerk durch Berücksichtigung von Wetterdaten usw.,
- 6. 360°-Marketing mit Daten aus Social Media, Helpdesk usw. und
- 7. Energieversorger (Nordeuropa-Projekte).
SAP HANA Vora soll Ende September für die Kunden verfügbar sein. Eine cloudbasierte Version für Entwickler ist ebenfalls für Ende des Monats geplant. „Vora ist ein Statement SAPs an den Markt, dass man in Walldorf Spark ernst nimmt und in diesem Segment mitmischen möchte“, urteilt PAC-Analyst Niemann. „Andere Anbieter, wie etwa die IBM, sind im Spark-Umfeld bereits sehr aktiv.“
(ID:43584363)