Graphdatenbanken TigerGraph stellt ML Workbench und SaaS-Erweiterungen vor

Von Michael Matzer

Anbieter zum Thema

TigerGraph, Anbieter einer Graph-Datenbank, hat auf seiner Anwenderkonferenz „Graph + AI Summit“ die Vorabversion seiner Machine Learning Workbench gezeigt und zahlreiche Neuerungen in seiner Cloud-Version vorgestellt. BigData-Insider sprach mit dem COO Todd Blaschka, der für die Customer Experience und die Unternehmensstrategie verantwortlich ist.

Beispiel für ein Dashboard aus dem Startbaukasten der TigerGraph Cloud, das die Interaktion innerhalb einer Graph-Datenbank zeigt. Die grafische Benutzeroberfläche von TigerGraph erleichtert die Nutzung der Graph-Funktionen.
Beispiel für ein Dashboard aus dem Startbaukasten der TigerGraph Cloud, das die Interaktion innerhalb einer Graph-Datenbank zeigt. Die grafische Benutzeroberfläche von TigerGraph erleichtert die Nutzung der Graph-Funktionen.
(Bild: TigerGraph)

Todd Blaschka, Chief Operating Officer bei TigerGraph
Todd Blaschka, Chief Operating Officer bei TigerGraph
(Bild: TigerGraph)

TigerGraph, Anbieter einer Graph-Datenbank, hat auf seiner Anwenderkonferenz „Graph + AI Summit“ die Vorabversion seiner Machine Learning Workbench gezeigt und zahlreiche Neuerungen in seiner Cloud-Version vorgestellt. BigData-Insider sprach mit dem COO Todd Blaschka, der für die Customer Experience und die Unternehmensstrategie verantwortlich ist.

TigerGraph ist eine massiv-parallele, in-memory ausgeführte Graph-Datenbank, die sich offenbar großer Nachfrage erfreut. „Wir sind von 22 Mitarbeitern in 2017 auf 350 Mitarbeiter weltweit in 2022 gewachsen“, sagte er im Gespräch. Im Jahr 2021 habe die Gartner Group vorausgesagt, dass schon bis 2025 vier von fünf Daten- und Analytikinnovationen mithilfe der Graph-Technology realisiert würden.

Blaschka zufolge sind TigerGraphs Kunden in den Branchen Finanzindustrie, Fertigung und vielen weiteren zu finden, in denen mit Graph Analytics Szenarien durchgespielt, Forecasts erstellt, Ähnlichkeiten gefunden und Produktempfehlungen erteilt werden. „KI und Graph-basierte Modelle gehören mittlerweile fest zu TigerGraph und sind in die Datenbank eingebettet“, sagte Blaschka.

Machine Learning Workbench

Vor diesem Hintergrund ist es für TigerGraph-Kunden wichtig, dass TigerGraph die Machine Learning Workbench in einer Vorabversion für den Einsatz im lokalen Rechenzentrum (on-premises) vorgestellt hat. Sie hat eine ähnliche Bedeutung wie etwa für AWS SageMaker und soll im August in die TigerGraph Cloud integriert werden. „Jedenfalls in der zweiten Jahreshälfte“, sagte Blaschka zurückhaltend. „MLOps entspricht Data Ops for ML. Das brauchen Data Scientists.“

Diese Benutzergruppe werde damit in die Lage versetzt, die Treffsicherheit ihrer ML-Modelle zu erhöhen, Entwicklungszyklen durch DevOps zu verkürzen und dem Geschäft mehr Wertschöpfung zu verschaffen, indem sie vertraute Werkzeuge, Workflows und Bibliotheken und einer einzigen Umgebung verwenden, die sich leicht mit vorhandenen Data Pipelines und bestehender Machine Learning Infrastruktur integrieren lässt. „Dazu gehören auch Kubernetes und Monitoring-Tools“, so Blaschka weiter.

Die ML Workbench basiert auf einem Python-Entwicklungs-Framework, das wiederum auf Jupyter-Notebooks fußt. Das Framework erlaubt es Data Scientists, rasch leistungsfähige Deep-Learning-Modelle, sogenannte Graph Neural Networks (GNN), zu erstellen, die angekoppelte Daten nutzen. „Graph-gestütztes Machine Learning ist“, zitiert Blaschka, „hinsichtlich Vorhersagen leistungsfähiger als der traditionelle Machine-Learning-Ansatz.“ Zu diesen Vorhersagen und Erkenntnissen gehören Betrugserkennung und erfolgreiche Produktempfehlungen, die zu den Edge-Vorhersage-Anwendungen gehören. Diese Modelle und Graph Neural Networks werden aufgrund der Integration in die massiv-parallele In-memory-Datenbank ebenso schnell ausgeführt.

Blaschka wies auf die zahlreichen Integrationsmöglichkeiten hin. Dazu gehören verbreitete DL-Frameworks wie etwa Google TensorFlow, PyTorch, PyTorch Geometric und DGL. Die Nutzer sollen in der Wahl ihres Frameworks flexibel sein können und dasjenige wählen, mit dem sie am meisten vertraut sind“, erläuterte Blaschka. Er fügte hinzu, dass die ML Workbench für Amazon SageMaker, Microsoft Azure ML und Google Vertex AI einsatzbereit sei.

„Die Lernkurve der Graph-Technologie, ihren APIs und Bibliotheken hat sich als ziemlich steil erwiesen“, fügt Victor Lee hinzu, der Vice President für Machine Learning und AI bei TigerGraph. „Deshalb haben wir mit der ML Workbench eine weitere Funktionsebene zwischen Data Scientists und den APIs und Libraries geschaffen, um so zudem die Datenspeicherung und -verwaltung, die Datenaufbereitung und das Machine Learning Training leichter zu gestalten.“ Erfreut fährt Lee fort: „Bei den Early Adopters haben wir durch die Nutzung der ML Workbench mit TigerGraph eine Verbesserung der Treffsicherheit ihrer ML-Modelle um zehn bis 50 Prozent gesehen.“

Datenqualität ist oft eine Herausforderung“, weist Blaschka hin, „aber nicht, wenn man die föderierte Erfassung von Daten in einer Graph-Datenbank nutzt.“ Die TigerGraph-Datenbank sei für die Nutzung von großen Enterprise-Datenmengen entworfen worden. „TigerGraph benötigt Big Data und Scale-out-Datenbanken, die umfangreiche Datenbestände fassen und bereitstellen können“, so der COO. „Unsere Partner sind: Intel, Dell, HPE und Xilinx.“ Xilinx stellt u. a. FPGA-Chips her. „Mit einem FPGA wie von Xilinx lässt sich die Performance um das Tausendfache gegenüber einer Plattform ohne FPGA steigern. Das ist u. a. gut für die Inferenz.“

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

Die User könnten GNNs selbst mithilfe von sehr großen Graphen leicht trainieren, denn die Workbench stelle ihnen folgende Fähigkeiten zur Verfügung. Erstens die verteilte Datenspeicherung und die massiv parallele Datenverarbeitung; zweitens die Graph-basierte Partitionierung, um Graph-Datenmengen für die Prozessschritte Training, Validierung und Test anzulegen; drittens Graph-basiertes Batching für GNN-Mini-Batch-Training, um die Performance zu steigern und die Hardware-Anforderungen zu senken; und viertens das Sampling von Graph-Untermengen, um bestimmte GNN-Modelliertechniken zu unterstützen.

Die Bedeutung der Datenaufbereitung sollte nach Ansicht Blaschkas nicht unterschätzt werden: „Die Vorstandsebene macht sich Sorgen um den Aspekt, dass die in den Modellen verwendeten Daten nicht nur nicht vollständig, sondern zudem auch mit Vorurteilen behaftet sein könnten.“ Nötig sei daher Responsible bzw. Explainable AI, weil sie für Audits und Rechtskonformität unerlässlich sei.

„TigerGraph jedoch verhilft Data Scientists zu einer höheren Transparenz ihrer Modelle. Denn es nutzt eine offene Programmiersprache mit quelloffenen Entitäten und erlaubt somit jedem Prüfer Einblick, wie ein Ergebnis zustande gekommen ist“, so der COO. „TigerGraph erlaubt die Frage: Was ist bzw. war die Ursache? Es erlaubt Was-wäre-wenn-Szenarien und es erstellt einen digitalen Zwilling eines Ablaufs und einer Infrastruktur.“

TigerGraph Cloud

TigerGraph läuft seit 2019 auch in der Cloud. Der Anbieter hat herausgefunden, dass Unternehmen in den aktuellen TigerGraph-Märkten USA und Europa ihre Analyse-Workloads zunehmend in die Cloud verlagern, sei diese nun Public, Hybrid oder Private. „Sie wollen die Nutzungsmöglichkeiten für TigerGraph erweitern“, erläutert Jay Yu, der Vice President für Produktinnovation. Als Antwort auf diesen Wunsch hat TigerGraph Ende Juni 29 weitere Leistungsmerkmale seiner SaaS-Version vorgestellt. Sie sollen vor allem Unternehmensanforderungen erfüllen.

Mit Identity and Access Management (IAM) kann ein Account von mehreren Usern genutzt werden, was dazu beitrage, Datenduplizierung zu vermeiden. Admins können rollenbasierte Zugriffsrechte zuweisen und das System auf diese Weise sicherer machen, aber auch Anwendungsfälle neu gestalten. Mit Single Login wird das Einloggen leichter gestaltet, und die Funktion „Secure Enterprise Connectivity“ erhöht die Sicherheit der Datenverbindungen der Plattform in der Cloud. Diese lässt sich mit AWS und Azure in weiteren Ländern wie Australien und Brasilien nutzen. So verwundert es nicht, dass TigerGraph die Regionen Lateinamerika und Asia-Pacific ins Visier genommen hat. Das Unternehmen will neue Märkte erschließen.

Das Cloud-Update umfasst eine sogenannte Freemium-Version von TigerGraph, die auf Azure läuft. Damit sollen potenzielle Kunden die TigerGraph Cloud erkunden können, um herauszufinden, ob sie ein Upgrade wollen. Preise in der Cloud sind häufig ein Buch mit sieben Siegeln, deshalb erklärt Blaschka zunächst die Preisgestaltung für die Nutzung on-premises: „Unser Preismodell basiert derzeit auf Compute-Jobs in-memory, weil TigerGraph ja eine In-memory-Datenbank ist. In der kommenden Cloud-Implementierung wird einerseits Storage berechnet, andererseits weiterhin die Compute-Jobs.“

Ausblick

Während die Juni-Neuerungen sich an Enterprise-Kunden richten, soll das nächste Release, das für Ende August avisiert ist, Endbenutzer ansprechen. Zu den willkommensten Neuerungen dürfte die Fähigkeit sein, mit TigerGraph Datenvisualisierungen auszuführen. „Die Kunden können dann Dashboards erstellen und rudimentäre Datenanalysen auf ihrer jeweiligen Datenbank erzeugen“, sagte Jay Yu.

Die Visualisierungsfunktionen seien nicht dafür ausgelegt, BI-Plattformen wie Qlik, Tableau oder Microsoft Power BI zu ersetzen. Diese Tools lassen sich mithilfe von Konnektoren ankoppeln. Die Visualisierungsfunktion soll Nutzer in die Lage versetzen, ihre Graphen leichter zu erkunden.

Artikelfiles und Artikellinks

(ID:48478594)