Aufbereitung und Analyse von Big Data mit NoSQL

Graphdatenbanken spielen bei stark vernetzten Daten ihre Stärken aus

Seite: 2/3

Firmen zum Thema

Ein Graph ist die allgemeine Bezeichnung für eine abstrakte Struktur, die eine Menge von Objekten zusammen mit den zwischen diesen Objekten bestehenden Verbindungen repräsentiert, in der Mathematik als Knoten und Kanten bezeichnet. Sowohl die Knoten als auch die Kanten können Eigenschaften, sogenannte Properties besitzen. Graphen werden meistens dargestellt durch einzelne Kreise, die mit Linien verbunden sind. Anschauliche Beispiele dafür sind Stammbäume, Mindmaps oder das U-Bahn-Netz einer Stadt. Eine wichtige Anwendung des Graphenmodells ist die Suche nach einer kürzesten Route zwischen zwei Orten in einem Straßennetz.

In einer Graphdatenbank lassen sich Daten in Form von Graphen speichern, verwalten und abfragen. Sie eignen sich besonders gut, stark vernetzte und/oder unstrukturierte Informationen anschaulich darzustellen. Denn sie weisen den gespeicherten Daten (beispielsweise Kunden oder Produkte) und der Beziehung zwischen diesen Daten die gleiche Bedeutung zu (beispielsweise „wer kauft was“ oder „welcher Kauf fand zuerst statt“). Diese Beziehungen werden also nicht mehr als bloße Metadaten abgetan, sondern stehen vielmehr im Zentrum des Modells.

Bildergalerie

Graphdatenbanken unterstützen unzählige dieser gerichteten Beziehungen zwischen den einzelnen Instanzen. So entsteht ein umfangreicher semantischer Kontext für die Daten. Verbindungen und Abhängigkeiten in Personen- aber auch Produktnetzwerken, wie Telekommunikationssysteme oder das immer stärker wachsende Internet of Things, können so umfangreich angegeben werden. Darauf aufbauend lassen sich neue Services entwickeln oder bestehende verbessern.

Schnelle Performance bei stark verknüpften Daten

Graphdatenbanken erleiden bei extrem vielen, miteinander verknüpften Datensätzen keine Performance-Verluste. Die Beziehungen zwischen Elementen müssen für eine Abfrage nicht aufwendig berechnet werden, sondern sind durch die vorliegenden Strukturen einfach verfolgbar. Die Abfragegeschwindigkeit hängt nicht von der Gesamtmenge der Daten in der Datenbank und der Anzahl von Verknüpfungsoperationen ab, sondern nur von der Anzahl der konkreten Beziehungen, die für die gewünschte Abfrage relevant sind.

Das Datenmodell lässt sich leicht mit beliebigen, zusätzlichen Hierarchien und Zugriffsstrukturen anreichern, die einen extrem schnellen Zugriff auf Teilaspekte der Daten ermöglichen. Neu gewonnene Informationen (beispielsweise Ähnlichkeit von Produkten oder relevante Empfehlungen für einen Kunden) können als neue Beziehungen im Graphen abgelegt werden, die dann sowohl Abfragen für BI als auch für Echtzeit-Anwendungsfälle weiter beschleunigen können.

Artikelfiles und Artikellinks

(ID:42986261)