Oracle erweitert HeatWave-Plattform für Generative KI

Oracle und Künstliche Intelligenz Oracle erweitert HeatWave-Plattform für Generative KI

09.07.2024 Von Michael Matzer 4 min Lesedauer

Anbieter zum Thema

ORACLE Deutschland B.V. & Co. KG

fsas-afc-horizontal-2-positive-rgb-nov24 (Fsas)

Fsas Technologies GmbH

Board Deutschland GmbH

INFOMOTION GmbH

Oracle hat für die KI-Plattform HeatWave eine Erweiterung für Generative KI verfügbar gemacht. HeatWave GenAI ist insofern bemerkenswert, als es das LLM in der Datenbank selbst ausführt. Zudem findet die Verarbeitung von Vektor-Daten, wie sie etwa für RAG (Retrieval Augmented Generation) benötigt wird, ebenfalls in der Datenbank statt. Diese Technik soll HeatWave GenAI performanter und sicherer als Lösungen von Mitbewerbern machen.

Zu den vorhandenen HeatWave-Funktionen kommt nun Generative KI mit einer Chat-Funktion hinzu.(Bild: Oracle) — Zu den vorhandenen HeatWave-Funktionen kommt nun Generative KI mit einer Chat-Funktion hinzu.
(Bild: Oracle)

Es gibt nach Angaben von Oracle Deutschland drei Kernkomponenten: Die Datenbank HeatWave MySQL als Frontend etwa für SQL oder VS Code, zweitens HeatWave Backend für die spaltenorientierte Datenspeicherung, die auch die Machine-Learning- und GenAI-Komponenten umfasst, und schließlich Object Storage, der die Kunden-Daten enthält.

Das HeatWave Framework umfasst bislang HeatWave Lakehouse, HeatWave Autopilot, HeatWave AutoML und den Objektspeicher HeatWave MySQL. Nun kommen vier weitere Funktionen hinzu, die generative KI-Modelle wie Llama 3, Cohere Command bzw. Embed oder Mistral ermöglichen sollen.

Bildergalerie

Die vier neuen Funktionen in HeatWave GenAI.(Bild: Oracle)

Der Vector Store macht unstrukturierte Daten aus dem Enterprise Content für die semantische Suche zugänglich.(Bild: Oracle)

Der Vector Store beliefert das LLM mit seinen Daten und erlaubt so die Vector-Datenverarbeitung für Applikationen wie Chat.(Bild: Oracle)

LLMs werden in der Datenbank ausgeführt und mit dem OCI GenAI Service angekoppelt.(Bild: Oracle)

Bildergalerie mit 9 Bildern

Wie Nipun Agarwal, der Senior Vice President für Oracle HeatWave, in einer Präsentation sagte, wird ein LLM wie Llama 3 in der Datenbank ausgeführt. Das soll die Kosten für die Erstellung und Ausführung von GenAI-Apps senken, etwa von Chatbots, da zusätzliche Infrastruktur wegfällt. „Kunden brauchen dann auch nicht mehr ,externe LLMs' zu wählen und zu integrieren“, so Agarwal. „Sie brauchen sich nicht um die Verfügbarkeit bestimmter LLMs bei den Cloud-Providern zu sorgen.“ Und die Sicherheit, die die Datenbank implementiere, komme der KI zugute, beispielsweise die Benutzerverwaltung.

LLMs in der Datenbank

Die In-Database-LLMs erfüllen die üblichen Aufgaben: Suche, RAG, Zusammenfassungen usw., nur eben mit dem HeatWave Vector Store (s. u.). Diese Aufgaben lassen sich mit AutoML kombinieren, um Machine-Learning-basierte Apps zu erstellen. HeatWave GenAI sei zudem mit dem OCI Generative AI Service integriert, um auf vortrainierte Funktionsmodelle bekannter LLM-Anbieter zugreifen zu können. OCI ist die Oracle Cloud Infrastructure.

Vektorisierung

Der HeatWave Vector Store mache das Bewegen von Geschäftsdokumenten aus der eigenen in eine gesonderte Vektor-Datenbank überflüssig. Die Erstellung dieses Vector Store und alle Vector-Einbettungen erfolgen laut Agarwal automatisch und werden in der Datenbank ausgeführt. Dazu gehört das Entdecken und Parsen von Dokumenten im Objektspeicher, ebenso die parallelisierte und performante Erzeugung von LLM-Einbettungen, die dann in HeatWave Vector Store eingefügt werden.

Die Nutzung von HeatWave Vector Store für RAG soll Halluzinationen von LLMs vorbeugen, weil das jeweilige Modell bei der Suche firmeneigene Daten heranzieht, die über den angemessenen Kontext verfügen. So würden die Modelle maximal zutreffende und relevante Antworten liefern.

Oracle macht keine Angaben über die Rolle von Governance in diesem Zusammenhang. Dieser zentrale Aspekt werde über HeatWave bzw. HeatWave MySQL und den zu Grunde liegenden „OCI Regions“ abgebildet, also über Funktionen der Datenbank. Die fragliche SQL-Datenbank ist naheliegenderweise Oracle selbst, kombiniert mit MySQL als Objektspeicher und InnoDB (s. u.).

Die Verarbeitung vektorisierter Daten soll sich im Scale-out-Modell beschleunigen lassen, sodass die semantische Suche schnelle Ergebnisse liefere. HeatWave unterstütze dabei den neuen, nativen Datentyp VECTOR und eine „optimierte Implementierung der Distanzfunktion“ zwischen den Vektorendpunkten, was die Kunden in die Lage versetzen soll, semantische Abfragen mit standardmäßigem SQL-Code auszuführen. Sie sollen keinen Code schreiben müssen. Hinweis von Oracle Deutschland: „HeatWave hat kein Indexing-Konzept.“

Neben dieser Scale-Out-Architektur und der hybriden Spaltendarstellung im Hauptspeicher (in-memory) soll es HeatWave damit ermöglichen, Vektordaten mit nahezu der gleichen Bandbreite wie der Hauptspeicher und zugleich bis zu 512 HeatWave-Rechnerknoten parallel zu verarbeiten. Oracle Deutschland fügt hinzu: „Das HeatWave Backend basiert auf AMD-CPUs – wir deklarieren die CPU-Typen aber nicht mehr. Die einzelnen HeatWave-Knoten sowie die HeatWave MySQL-Frontend-Knoten sind via TPCI/IP im OCI-Netzwerk miteinander verbunden, das heißt, das Netzwerk ist nicht transparent für den Anwender.“

Die Latenz bis zur Antwort des Modells sei aufgrund dieser Voraussetzungen gering, und Benchmarks hätten dies belegt. Die semantische Suche lasse sich mit weiteren SQL-Operatoren kombinieren, um beispielsweise mehrere Tabellen mit unterschiedlichen Dokumenten zu kombinieren und ähnliche Suchvorgänge über alle verfügbaren Dokumente auszuführen.

HeatWave Chat

HeatWave Chat ist ein Plug-in für die MySQL-Shell, geschrieben in „Visual Code“. Oracle Deutschland erläutert dazu: „Wir verwenden Typescript, mit Python im Backend. Die MySQL Shell ist in C++ geschrieben. Als Umgebung verwenden die Kollegen VS Code. Es stellt dem Nutzer eine grafische Benutzeroberfläche zu HeatWave GenAI zur Verfügung, in die er Eingaben machen kann. Entwickler sollen damit Fragen in natürlicher Sprache oder SQL stellen können. Der integrierte Lakehouse Navigator soll es Nutzern erlauben, Dateien aus dem Objektspeicher zu selektieren und damit selbst einen Vektorspeicher zu erstellen.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Geschäftliche E-Mail

Bitte geben Sie eine gültige E-Mailadresse ein.

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Stand: 08.12.2025

Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.

Einwilligung in die Verwendung von Daten zu Werbezwecken

Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.

Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.

Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.

Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.

Recht auf Widerruf

Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.

Nutzer sollen die gesamte Datenbank ebenso leicht durchsuchen können, wie sie die Suche auf ein bestimmtes Verzeichnis eingrenzen können. HeatWave bewahre den Kontext, zusammen mit den bereits gestellten Fragen, mit Zitaten aus den Quelldokumenten sowie mit der Prompt-Eingabe an das LLM. Oracle Deutschland erläutert: „Diese Daten werden als Metadaten im HeatWave MySQL Frontend (also in InnoDB & VectorStoreDB) persistiert.“

Diese Möglichkeiten sollen eine kontextbezogene Konversation erleichtern und es den Nutzern erlauben, die Quelle der vom LLM erzeugten Antworten ausfindig zu machen und zu verifizieren. Dieser Kontext werde in HeatWave selbst gepflegt: „… in InnoDB HeatWave MySQL als Teil einer angelegten Tabelle (im JSON-Format).“ Somit stehe der Kontext jeder Applikation zur Verfügung, die HeatWave verwendet.

Leistungsaspekte

„Die Erstellung eines Vektordatenspeichers für Dokumente in Formaten wie PDF, PPT, WORD und HTML erfolgt mit HeatWave GenAI 23-mal schneller und zu einem der Viertel der Kosten, als wenn stattdessen Knowledge-Base für Amazon Bedrock verwendet wird“, sagte Agarwal. Er signalisierte damit, wo Oracle die entscheidenden Vorteile für seine HeatWave-Kunden sieht: bei Performance und Kosten, aber auch Bedienfreundlichkeit.

(ID:50089535)