Big Data in SAP Hybris Für alle Datentypen gewappnet

Von Michael Matzer |

Anbieter zum Thema

Die Datenplattform der E-Commerce-Suite SAP Hybris ist für die Verarbeitung aller Arten von Daten ausgelegt. Die Informationen werden aber nicht nur einfach in einer Art Data Lake gesammelt, sondern zuerst validiert, bevor sie auf leistungsfähiger Infrastruktur wie etwa Oracle Exadata oder SAP HANA gespeichert werden. Das Spring Framework bietet zusätzliche Optionen zur Erweiterung.

Die minimale Systeminfrastruktur einer Hybris-Installation besteht bereits aus massiven Systemen.
Die minimale Systeminfrastruktur einer Hybris-Installation besteht bereits aus massiven Systemen.
(Bild: SAP)

Auf einer SAP-Hybris-Kundenkonferenz in München gewährte die SAP-Tochter kürzlich eine Vorschau auf ihre im zweiten Quartal 2016 kommende neue Plattformversion. In der Cloud kann sie die Leistung der SAP HANA Cloud Platform (HCP) nutzen, on-premise sind mehrere Datenbanken nutzbar – siehe unten.

Die Commerce Suite bringt zahlreiche Neuerungen mit sich. Eine davon ermöglicht im Produkt „Hybris Profile“ das Anlegen von Kundenprofilen in verschiedenen Graden der Granularität, um so jede Art von Kundeninteraktion einzufangen und auswerten zu können. Dabei verfolgt das Profile-Produkt die Reise des Kunden von Webseite zu Webseite und speichert sich für die Clickstream-Analyse – eine schon seit Jahren verbreitete Technik der Websurfing-Auswertung. Neu ist diesmal die Erstellung eines Beziehungsnetzwerks in Echtzeit und in drei Dimensionen. Werkzeug dafür war eine bis dato ungenannte Graph-Datenbank, wie sie etwa bei Facebook verwendet wird.

Bildergalerie
Bildergalerie mit 6 Bildern

Datenschutzverordnung „eingebaut“

Brian Walker, Senior Vice President (SVP) of Strategy bei Hybris, verweist jedoch gleich darauf, dass Hybris die Europäische Datenschutzverordnung quasi „eingebaut“ habe. Das ist natürlich für europäische und besonders auf die sicherheitsbewussten deutschen Kunden von großer Bedeutung. Riad Hijal, Global Vice President für Solution & Strategy, ergänzt: „Wir glauben, dass es die Endverbraucher und Endbenutzer sind, die die Einschränkungen vornehmen sollten, wenn es um Aspekte wie etwa Online-Tracking und Datenschutz geht.“ Hijal weist auf die semantische Textanalyse hin, die in Hybris Profile ebenfalls eingebaut sei: „Deshalb kommt es bei Empfehlungen an den Kunden nicht mehr zu Verwechslungen wie etwa zwischen ,Scotch‘-Whisky und ,Scotch‘-Klebeband.“

SAP Hybris und Big Data

SAP Hybris erhebt den Anspruch, alle Arten von Kanälen in einer Omni-channel-E-Commerce-Plattform zusammenführen und bedienen zu können. Für diesen Zweck hat die Plattform zusammen mit ihrer Infrastruktur eine große Menge von unterschiedlichsten Datentypen zu verarbeiten: Big Data mit den klassischen Merkmalen Geschwindigkeit, Umfang, Varietät und Korrektheit (Velocity, Volume, Variety und Veracity).

Um so stark wie für Big Data nötig skalieren zu können, ist eine virtualisierte Umgebung unerlässlich. Deshalb laufen die Anwendungen der Hybris-Plattform in entsprechenden Containern. Von Haus aus sind bereits die Servlet-Container Tomcat und tcServer vorkonfiguriert. So können die Hybris-Lösungspartner schnelle Installationen auf die Beine stellen und das erforderliche Enterprise Application Archive (EAR), das dann auf Java und der Java VM ausgeführt werden kann. Die Nutzung von Hypervisoren ermöglicht die Ausführung auf einer beliebigen Betriebssystemplattform (Windows, Mac OS X, Unix).

In einer solch skalierbaren und gut verteilbaren Plattform lassen sich auf der untersten Schicht des Technikstapels verschiedene Datenbanksysteme nutzen. Diese geben dem Kunden die Freiheit, bereits bestehende Investitionen in Datenbanken weiterzuverwenden oder auf leistungsfähigere Datenbanksysteme zu migrieren. Aktiv unterstützt Hybris bereits Oracle, MySQL, den Percona XtraDB Cluster, SAP HANA DB und Microsoft SQL Server. Oracle kann beispielsweise auf einer Exadata-Appliance oder einem RAC-Cluster betrieben werden und wer HANA möglichst skalierbar nutzen will, kann die SAP-HANA-Cloud-Plattform als Public-Cloud-Infrastruktur nutzen.

Core+-Module

Hinsichtlich der nötigen Flexibilität, um alle Art von Massendaten zu verarbeiten, reichen diese Datenbanksysteme manchmal nicht aus. Da die Hybris-Persistenz-Schicht nicht mit Triggern und Stored Procedures arbeitet, ist es laut Hersteller möglich, nicht nur Anwendungen wie CRM und ERP anzukoppeln, sondern auch die Datenhaltungsschicht um Anwendungen zu erweitern, die das SOA-ähnliche Core+-Prinzip unterstützen. Der Wechsel zu einer anderen Datenbank sei dann einfach.

Core+-Module werden wie Web-Applikationen über die REST-Programmierschnittstelle angebunden. Zu solchen Anwendungen kann beispielsweise die NoSQL-Datenbank MongoDB gehören, die Hybris bereits unterstützt. Es kann aber auch eine Graph-Datenbank wie Neo4j sein, um komplexe Retail-Sachverhalte effizient zu handhaben. Als eine Vorschau auf ein visuelles Marketing-Feature wie Hybris Profile stattfand, war die Funktion „Customer Profile Graph“ zu sehen.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

Mithilfe einer Graph-Datenbank wie Neo4j, die Beziehungen sichtbar macht, kann sich der Nutzer in Echtzeit das Beziehungsnetzwerk eines Kunden oder Interessenten darstellen lassen – und das dreidimensional. Zu jeder Identität werden kontextuelle Details angezeigt, so etwa die IP-Adressen des Nutzers und seiner „Freunde/Fans“. Das ist für Marketingmitarbeiter sehr nützlich, denn es erleichtert ihnen die Personalisierung ihrer Kundenansprache.

Eine Sache der flexiblen Datenintegration

Alle Typen von nützlichen Massendaten müssen früher oder später integriert werden. Für diesen wichtigen Schritt stellt Hybris-Plattform mehrere Werkzeuge zur Verfügung. Jedes Business Object in Hybris wird demnach über die ServiceLayer-Schnittstellen validiert. Diese Beurteilung basiert auf JSR 303 (Bean Validation) mit zusätzlichen Funktionen, die es ermöglichen, zur Laufzeit Bedingungen für Validierungseinschränkungen festzulegen. Im Administration Cockpit kann daher der Nutzer feingranulare Validierungsbedingungen für jedes Hybris-Objekt festlegen, ohne die Plattform jedes Mal neu starten zu müssen.

Für den Im- und Export von Daten steht die ImpEx-Engine bereit. Mir ihr lassen sich massenhaft Textdateien importieren, etwa aus Blogs und Postings. Das native Format ist CSV (comma-separated value), aber quelloffene ETL-Werkzeuge wie Talend lassen sich ebenfalls nutzen, um andersartige Daten ins ImpEx-Format zu konvertieren. Danach arbeitet ImpEx mit der Service- und Persistenzschicht zusammen, um die empfangenen Daten in die jeweils genutzte Datenbank zu schreiben.

Die zweite Integrationsmöglichkeit besteht in der Nutzung des Data Hubs. Diese Schaltstelle ist wesentlich flexibler als ImpEx und lässt sich durch Partnerlösungen nach Bedarf erweitern. Die Hauptsorge gilt hier der Datenqualität, also der Bereinigung und dem Erhalt von Abhängigkeiten zwischen Daten, bevor sie in die Commerce Suite gelangen. Data Hub unterstützt alle relevanten Im- und Export-Dateiformate, um den Datenaustausch mit Applikationen wie ERP oder mit Storage-Lösungen zu bewältigen. Neben den REST-basierten Web Services kann Data Hub auch mit dem Spring Framework erweitert werden.

(ID:43962096)