Charmed Spark vorgestellt Canonical erleichert den Einsatz von Apache Spark auf Kubernetes

Von Martin Hensel Lesedauer: 1 min |

Anbieter zum Thema

Mit Charmed Spark hat Canonical eine Lösung vorgestellt, die den Einsatz von Apache Spark auf Kubernetes vereinfachen soll. Sie bringt alle dazu nötigen Bestandteile in einem Paket mit.

Charmed Spark von Canonical soll den Einsatz von Apache Spark auf Kubernetes vereinfachen.
Charmed Spark von Canonical soll den Einsatz von Apache Spark auf Kubernetes vereinfachen.
(Bild: Canonical)

Apache Spark ist für den Einsatz in verschiedenen Datenverarbeitungsanwendungen geeignet. Dazu zählen etwa Predicitive Analytics, Data Warehouse sowie Datenaufbereitung für maschinelles Lernen und Extract-Transform-Load (ETL). Ubuntu-Herausgeber Canonical will mit Charmed Spark nun für mehr Benutzerfreundlichkeit sorgen und das Daten-Engineering sowohl in Public Clouds als auch On-Premises beschleunigen. Zudem ist ein umfassendes Support- und Sicherheitspaket verfügbar.

„Charmed Spark ist die erste von vielen Open-Source-Datenlösungen von Canonical, die auf Zuverlässigkeit und Multi-Cloud-Betrieb ausgelegt sind. Jede Produktionsimplementierung beinhaltet eine 10-Jahres-Garantie für Compliance und Sicherheitswartung“, erklärt Canonical-CEO Mark Shuttleworth.

Sichere Quelle

Laut Canonical ist die aktuelle Kubernetes-Infrastruktur stark von Container-Images abhängig. Die Herkunft quelloffener Images ist aber oft nur schwierig sicherzustellen. Das auf Github verfügbare Charmed-Spark-OCI-Image schafft hier Abhilfe und wird zudem durch das Ubuntu-Pro-Abonnement unterstützt. Die Abrechnung des Supports erfolgt hierbei pro Knoten statt pro Anwendung.

Charmed Spark soll Spark auf Kubernetes ausführen und so eine Cloud-native Portabilität zwischen Clouds und On-Premises-Rechenzentren ermöglichen. Mit an Bord sind unter anderem eine verbesserte Python-Integration sowie ein erweiterter Spark-SQL-Funktionsumfang. Enthalten sind die Python-Entwicklungsumgebung spark8t, der Spark-Client Snap und ein Spark-Container-Image auf Basis von Ubuntu 22.04 LTS. Auf diese Weise ergibt sich eine sofort einsetzbare Laufzeitumgebung zum Erstellen von Spark-Anwendungen, die auf Kubernetes-Clustern laufen. Bereitstellung, Konfiguration und Betrieb lassen sich über den spark-history-server-k8s-Operator einschließlich der Open-Source-Orchestrierungsengine Juju und auf Wunsch über das deklarative Codierungstool Terraform umsetzen.

(ID:49761242)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung