Suchen

Für openCypher-Projekt Neo4j stellt Cypher for Apache Spark vor

| Autor / Redakteur: Martin Hensel / Nico Litzel

Der Graph-Plattformanbieter Neo4j hat eine frühe Version von Cypher for Apache Spark (CAPS) präsentiert. Das Toolkit für das openCypher-Projekt erweitert das Hadoop-Ökosystem um Graph-Analysefunktionen für Spark.

Firmen zum Thema

Das openCypher-Projekt erweitert das Hadoop-Ökosystem um Graph-Analysefunktionen für Spark.
Das openCypher-Projekt erweitert das Hadoop-Ökosystem um Graph-Analysefunktionen für Spark.
(Bild: Neo4j)

Bislang konnten Datenwissenschaftlicher Graph Pattern Matching unter Spark nicht ohne Einschränkungen nutzen. CAPS soll Abhilfe schaffen und existierende Datenquellen viel schneller mit Graph-Anwendungen verbinden. Big-Data-Analysten können mit CAPS einfacher Graph-Abfragen in Workflows nutzen, Graph-Algorithmen einbinden und Datenverbindungen aufdecken. Neben Apache Spark unterstützen auch SAP HANA, Redis, AgensGraph und Neo4j die deklarative Graph-Abfragesprache Cypher. Entwickler können innerhalb des openCypher-Projekts unter der Apache-2.0-Lizenz auf die Tools zugreifen. Zu den weiteren Funktionen von CAPS zählen Optionen für multiple Graphen sowie modulare Abfragen, die in Kooperation mit der openCypher Implementers Group entstanden sind.

Flexiblere Datenverarbeitung

„Um Cypher für Apache Spark verfügbar zu machen, haben wir uns angesehen, wie Spark mit unveränderlichen Datensätzen arbeitet. In Abstimmung mit der openCypher-Community haben wir die Möglichkeit geschaffen, Graph-Abfragen über die Ergebnisse von vorherigen Graph-Abfragen durchzuführen. Eine API erlaubt es, Graphen aufzuteilen, zu transformieren, oder in verschiedenen Versionen festzuhalten und solche Graphen in komplexe Abläufe einzubinden. Dadurch lassen sich Graph-Daten, einschließlich der Daten aus Data Lakes, von Anwendern flexibler verarbeiten. Cypher für Apache Spark ist die erste Anwendung von Cypher, in der man als Abfrageergebnis sowohl Datentabellen, als auch Graphen erhält“, erklärt Philip Rathle, Vice President of Products von Neo4j.

Das Open-Source-Projekt openCypher hat das Ziel, Graph-Datenbanken weiter zu etablieren. Zudem soll Cypher als Gemeinschaftsprojekt weiterentwickelt werden, um redundante Entwicklungsarbeit zu minimieren. Zur openCypher-Implementierungsgruppe zählen mehr als 20 Unternehmen, Organisationen und Hochschulen.

(ID:44971642)