MySQL HeatWave Lakehouse vorgestellt Oracle bringt Datenabfragen auf Trab

Von Martin Hensel

Anbieter zum Thema

Mit MySQL HeatWave Lakehouse will Oracle für schnelle Verarbeitung und Abfrage von großen Datenmengen im Objektspeicher sorgen. Die Lösung soll eine deutlich höhere Performance als Snowflake und Redshift erreichen.

Oracle baut sein HeatWave-Portfolio weiter aus.
Oracle baut sein HeatWave-Portfolio weiter aus.
(Bild: Oracle)

MySQL HeatWave Lakehouse soll Kunden die Verarbeitung und Abfrage von Hunderten Terabyte an Daten im Objektspeicher in einer Vielzahl von Dateiformaten ermöglichen. Dazu zählen beispielsweise CSV, Parquet sowie Aurora- und Redshift-Backups. Das Lakehouse ergänzt Oracles bestehendes MySQL-HeatWave-Portfolio, das Transaktionsverarbeitung, Analytics, maschinelles Lernen und Automatisierung in einer einzigen Datenbank vereint.

Eine massiv parallelisierte Scale-Out-Architektur sorgt bei der Ausführung von Abfragen und dem Laden von Daten für hohe Leistung. Oracle belegt dies durch Benchmark-Ergebnisse im Vergleich mit anderen Lösungen: So liegt die Abfrage-Performance von MySQL HeatWave Lakehouse im „400 TB TPC-H-Benchmark“ um den Faktor 17 über Snowflake und ist sechsmal schneller als Amazon Redshift. Das Laden von Daten erfolgt laut dem Benchmark achtmal schneller als in Redshift und 2,7-mal schneller als in Snowflake. Die Benchmark-Skripte sind auf Github verfügbar und lassen sich damit reproduzieren.

Funktionen im Überblick

Oracles MySQL HeatWave Lakehouse unterstützt Abfragen bis zu 400 Terabyte an Daten. Der HeatWave-Cluster lässt sich auf bis zu 512 Knoten skalieren. Datenabfragen erfolgen nach der MySQL-Standardsyntax. Die Abfrageleistung und der Komprimierungsgrad für Daten in der MySQL-Datenbank und im Objektspeicher sind identisch. Durch die Unterstützung verschiedener Dateiformate können Nutzer die Vorteile des Lakehouse auch dann nutzen, wenn ihre Daten nicht in einer MySQL-Datenbank vorliegen. Zudem können sie OLTP-Daten aus ihrer MySQL-Datenbank abfragen und mit im Objektspeicher abgelegten Daten kombinieren.

Zu den Neuerungen zählen auch ergänzte Autopilot-Funktionen für MySQL HeatWave Lakehouse. So wurden unter anderem das automatische Provisioning und die Verbesserung von automatisierten Abfrageplänen entsprechend erweitert. Automatische Schema-Inferenz, adaptive Datenerfassung und Datenfluss sowie automatisches Laden von Daten sind ebenfalls neu an Bord.

„Die Zahl der außerhalb von Datenbanken gespeicherten Daten nimmt stark zu. Mit MySQL HeatWave Lakehouse können Kunden alle Vorteile von HeatWave für Daten nutzen, die sich im Objektspeicher befinden“, erklärt Edward Screven, Chief Corporate Architect von Oracle. „MySQL HeatWave bietet jetzt einen einzigen integrierten Service für mehrere Cloud-Umgebungen für Transaktionsverarbeitung, Analysen in Data Warehouses und Data Lakes sowie für maschinelles Lernen ohne ETL“, ergänzt er.

(ID:48727236)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung