Suchen

E-Book von BigData-Insider Graph-Datenbanken

| Autor / Redakteur: Michael Matzer / Nico Litzel

Aus dem täglichen Umgang mit dem Internet ist die Nutzung von verknüpften Daten nicht mehr wegzudenken. Seien es Freundschaftskreise auf Facebook und LinkedIn, Taxi-Anforderungen auf Uber oder Empfehlungen auf Amazon und Ebay – immer tritt im Hintergrund eine Datenbank in Aktion, die verwandte Daten sucht und miteinander in Beziehung setzt. Dabei handelt es sich in den meisten Fällen um eine Graph-Datenbank.

Firmen zum Thema

Ab sofort steht das E-Book „Graph-Datenbanken“ für registrierte Leser von BigData-Insider kostenlos zum Download bereit.
Ab sofort steht das E-Book „Graph-Datenbanken“ für registrierte Leser von BigData-Insider kostenlos zum Download bereit.
(Bild: Vogel IT-Medien)

Wo relationale Datenbanken (RDBMS) die zu speichernden Daten in ihre Bestandteile zerlegen, um sie in Zeilen und Spalten zu stopfen, tun Graph-Datenbanken das Gegenteil: Sie belassen die Daten, wo sie sind und erfassen sie in einem Modell, das in der Regel aus Knoten, Kanten (Beziehungen), Eigenschaften besteht: Dieser Graph bietet den Kontext, den Nutzer wie Facebook oder Amazon ihren Kunden bieten müssen, um sowohl das Kundenerlebnis zu verbessern, als auch um selbst die Erfolgsquote bei der Lead-Konversion zu verbessern: Aus Besuchern sollen Fans und aus Fans Käufer werden.

Die Anwendungsfälle reichen noch viel weiter: vom Einsatz in der Streckenoptimierung über Genom-Analyse bis hin zu Betrugserkennung und Verbrechensbekämpfung. In der IT werden Graph-Datenbanken in der Netzwerkanalyse, der Anomalieerkennung (SIEM) und im Master Data Management (MDM) genutzt. Die Liste ließe sich fortsetzen.

Die Mehrzahl der Graph-Datenbanken entstand aus dem Open-Source-Markt und ist diesem immer noch verpflichtet. Das unterscheidet die Graph-Datenbanken einerseits von den proprietären RDBMS wie SAP und Oracle, bedeutet aber auch eine gewisse Zersplitterung hinsichtlich eines gemeinsamen Standard in Sachen Abfrage. Auf dem Weg zu einer internationalen und allgemeinen Anerkennung seiner Abfragesprache Cypher ist der Anbieter Neo4J durch seine marktbeherrschende Stellung und durch geschickte Partnergewinnung kurz vor dem Ziel: eine standardisierte Abfragesprache für alle Graph-Datenbanken.

Der Inhalt

Das E-Book Graph-Datenbanken macht Leser zunächst mit den Eigenheiten und den Anwendungsgebieten einer Graph-Datenbank bekannt, bevor es in die Tiefen der Technologie abtaucht. Wer schon Erfahrung mit RDBMS mitbringt, ist klar im Vorteil, denn Begriffe wie ACID-Konformität sind dann bereits bekannt.

Das dritte Kapitel stellt die bekanntesten Vertreter im Graph-Datenbankmarkt vor. Es gibt über 20 Anbieter, und das ist nur eine winzige Auswahl. Dazu gehören der Marktführer Neo4J, dann die Nummer zwei, das Apache-Projekt TinkerPop, schließlich Apache Spark, Amazon Neptune (erst seit September 2018 auf dem Markt) und schließlich SAP HANA. HANA ist ein Beispiel für eine hybride Integration von Graph-Analyse und RDBMS.

Neo4J treibt die Unterstützung für die Abfragesprache SQL voran, denn diese wird besonders von Unternehmensanalytikern genutzt. Die jüngsten Editionen der Neo4J- Graph-Datenbank sind stark auf den Enterprise-Markt ausgerichtet. Natürlich steht Neo4J auch in der Cloud zur Verfügung, unter dem Namen „Aura“.

Bereit für KI

In Sachen Modernität brauchen sich alle Graph-Datenbanken nicht zu verstecken. Stets lassen sich moderne Algorithmen, die etwa aus R stammen können, für Machine Learning nutzen. Für Deep Learning steht eine Anbindung an Google TensorFlow etc. bereit. Eine Visualisierung erfolgt mit bordeigenen Mitteln oder verbreiteten Werkzeugen wie Tableau.

Eine Liste von wohlbegründeten Kriterien für die Wahl einer geeigneten Graph-Datenbank bietet Amit Chaudrys kostenloser „Buyer's Guide for Graph Databases“, den man auf der Neo4J-Webseite (nach Angaben einiger Kontaktdaten) herunterladen kann.

Artikelfiles und Artikellinks

(ID:46266265)

Über den Autor