Definition Was ist Amazon Neptune?

Autor / Redakteur: Dipl.-Ing. (FH) Stefan Luber / Nico Litzel

Amazone Neptune ist ein Graphdatenbankservice aus der Cloud. Der Service ist voll gemanagt und wird im Rahmen der Amazon Web Services angeboten. Mit Graphdatenbanken lassen sich untereinander verknüpfte Datensätze performant speichern, bearbeiten und abfragen. Amazon Neptune ist seit 2018 verfügbar.

Anbieter zum Thema

(Bild: © aga7ta - stock.adobe.com)

Bei Amazon Neptune handelt es sich um einen Graphdatenbankservice aus der Cloud. Er wird als voll gemanagter Service im Rahmen der Amazon Web Services (AWS) angeboten. Mithilfe von Amazon Neptune lassen sich untereinander in Beziehung stehende, stark verknüpfte Daten in einer gut skalierbaren Datenbank performant speichern, abfragen und bearbeiten. Die Datenbank ist eine Art von NoSQL-Datenbank und versteht Abfragesprachen wie SPARQL oder Apache TinkerPop Gremlin.

Der Datenbankservice ermöglicht die Erstellung von Anwendungen, die mit stark verknüpften Daten arbeiten und liefert Abfrageergebnisse mit niedriger Latenz im Millisekundenbereich. Gängige Diagrammmodelle wie der Property Graph oder das Resource Description Framework (RDF) werden unterstützt. Der Graphdatenbankservice ist hoch verfügbar und wird stetig gesichert. Per HTTPS verschlüsselte Clientverbindungen und Verschlüsselung im Ruhezustand (Encryption at Rest) tragen zur Datensicherheit des Services bei.

Typische Anwendungsbereiche sind soziale Netzwerke, Betrugserkennung, Empfehlungs-Engines oder Wissensdiagramme. Vorgestellt wurde der Service 2017. Seit 2018 ist er in mehreren Regionen im Rahmen der Amazon Web Services für Anwender verfügbar. Das Kostenmodell von Amazon Neptune ist nutzungsbezogen.

Grundsätzliches zur Verwendung und zur Funktionsweise von Graphdatenbanken

Eine Graphdatenbank ist ein besondere Form einer Datenbank, die speziell für das Speichern, Verarbeiten und Abfragen von in Beziehung stehenden Daten entwickelt ist. Gegenüber relationalen Datenbanken bieten sich zahlreiche Vorteile. So lassen sich Beziehungen zwischen Daten wesentlich schneller erstellen und abfragen, da keine komplexen SQL-Abfragen und Tabellen mit Fremdschlüsseln erstellt werden müssen.

Graphdatenbanken basieren auf sogenannten Knoten und Kanten. Die Knoten stellen die Daten dar und die Kanten die Beziehungen der Daten untereinander. Beliebige Datenelemente der Knoten lassen sich über die Kanten miteinander direkt verknüpfen.

Wichtige Funktionen der Amazon-Neptune-Graphdatenbank

Die Amazon Neptune bietet die Möglichkeit, Abfragen mit den Graph-basierenden Abfragesprachen Apache TinkerPop Gremlin und SPARQL durchzuführen. Die zentrale Komponente des Services ist eine hoch verfügbare, performante Graphdatenbank-Engine. Sie kann Milliarden von Beziehungen speichern und liefert Abfrageergebnisse mit Latenzen im Millisekundenbereich. Die Verfügbarkeit und Datensicherheit werden über Read Replicas, stetige Sicherungen und zeitpunktbezogener Wiederherstellung sichergestellt. Die Daten sind während der Übertragung und im Ruhezustand der Datenbank verschlüsselt. Sämtliche Verwaltungsaufgaben der Datenbank wie das Einspielen von Softwareupdates oder das Monitoring des Services werden von Amazon geleistet.

Als Graphmodelle lassen sich der Property Graph oder das RDF-Modell der W3C verwenden. Der Speicher und die Rechenleistung von Amazon Neptune skalieren automatisch. Es sind Volumes bis 64 Terabyte möglich. Ausgeführt wird der Graphdatenbankservice in einer Amazon Virtual Privat Cloud (VPC). Die eigene IT-Infrastruktur lässt sich sicher mit verschlüsselten IPsec-VPNs mit Amazon Neptune verbinden. Über Firewall-Funktionen werden die Zugriffe auf die Datenbank kontrolliert. Das AWS Identity and Access Management (IAM) legt fest, welche Benutzer oder Gruppen welche Rechte bei der Nutzung der Datenbank haben. Die komplette Graphdatenbank kann mit wenigen Klicks über die Management Console geklont werden

Die Vorteile des Graphdatenbankservices Amazon Neptune

Der voll gemanagte Datenbankservice Amazon Neptune bietet zahlreiche Vorteile. Kurz zusammengefasst sind das:

  • Unterstützung der Open Graph APIs für Gremlin und SPARQL
  • Unterstützung der Graphmodelle Property Graph und RDF
  • hohe Abfrage- und Verknüpfungsleistung
  • Unterstützung von bis zu 15 Read Replicas über drei Availability Zones
  • gute Skalierbarkeit
  • mehr als 100.000 Diagrammabfragen pro Sekunde ausführbar
  • für eine Verfügbarkeit von mehr als 99,99 Prozent konzipiert
  • automatische Sicherungen und Fehlerbehebungen
  • Instance-Failover in weniger als 30 Sekunden
  • sehr sicher dank Netzwerkisolierung mit Amazon VPC, HTTPS-Verschlüsselung der Clientzugriffe und Verschlüsselung im Ruhezustand
  • voll gemanagt von Amazon
  • nutzungsbezogenes Abrechnungsmodell

Die verschiedenen Anwendungsmöglichkeiten des Graphdatenbankservices Amazon Neptune

Amazon Neptune ist für Anwendungen besonders gut geeignet, die auf stark verknüpften Daten basieren. Die Graphdatenbank kann Verbindungen in großen Datenmengen speichern, verarbeiten und abfragen. Typische Anwendungsbereiche sind:

  • Anwendungen im Umfeld sozialer Netzwerke
  • Anwendungen zur Betrugserkennung
  • Empfehlungs-Engines für Produkte
  • auf Wissensdiagramme basierende Anwendungen
  • Anwendungen im Gesundheitswesen und in der Biowissenschaft
  • Abbildung von Vorgängen und Fehlerdiagnosen im Umfeld komplexer Netzwerke und IT-Anwendungen

(ID:46018135)