Cloudera Data Platform als Software as a Service Cloudera will Datenanalysen in der Cloud erleichtern

Von Michael Matzer

Anbieter zum Thema

Noch diesen Herbst will Cloudera, ein Spezialist für Hybrid-Cloud-Datenarchitekturen, die Cloudera Data Platform (CDP) One als Software as a Service allgemein verfügbar machen. Das Cloud-Angebot basiert auf der Data-Lakehouse-Architektur und ermöglicht schnelle sowie einfache Self-Service-Analysen und explorative Datenanalyse für alle Arten von Daten. BigData-Insider sprach darüber mit Alexander Zschaler, Vertriebsleiter Deutschland bei Cloudera.

Alexander Zschaler, Regional Sales Manager Germany bei Cloudera
Alexander Zschaler, Regional Sales Manager Germany bei Cloudera
(Bild: Cloudera)

Als erstes All-in-One-SaaS-Angebot, das auf der Data-Lakehouse-Architektur basiert, soll CDP One den Wechsel in die Cloud und die Migration bestehender Workloads auf eine moderne Datenarchitektur für Unternehmen schneller, einfacher und risikoärmer machen. Das Problem, das Cloudera mit CDP One beheben will, besteht nach Angaben der Analysten von Ventana Research darin, dass fast drei Viertel der befragten Unternehmen ihre Analyse- und Datenprozesse weiterhin on-premises ausführen. Die Hauptgründe, warum Unternehmen nicht vorhaben, Cloud Computing für ihre Analysen und Daten zu nutzen, sind Sicherheit, fehlende Expertise und Ressourcen im Unternehmen sowie regulatorische Herausforderungen, wie etwa Compliance und Governance.

Jeder Nutzer, vom unerfahrenen Einsteiger bis zum fachkundigen Entwickler, kann die Vorteile von Low-Code-Tools, Streaming Analytics und Machine Learning nutzen. Ad-hoc-Analysen und individuell anpassbare Analysen lassen sich über den gesamten Datenlebenszyklus hinweg über eine sichere, zentralisierte Datenplattform durchführen. Cloudera will Kunden helfen, einen Vendor-Lock-in durch die Bindung an einen einzigen Hersteller von Analyse-Tools zu vermeiden. Mit der Lakehouse-Architektur lassen sich sowohl strukturierte als auch unstrukturierte Daten verarbeiten.

Bildergalerie

Die Rolle der KI

Das SaaS-Angebot vereint Cloud Computing, Cloud Storage, Machine Learning, Streaming Analytics und integrierte Sicherheit auf Unternehmensniveau. „CDP One beinhaltet die gesamten Services für Machine Learning von Cloudera“, sagt Zschaler. „Dazu zählen auch die Applied Machine Learning Prototypes, kurz AMPs, die mit einem Klick bereitgestellt werden. AMPs sind vordefinierte, aber anpassbare Lösungen, die gängige Anwendungsfälle abdecken. So können beispielsweise Telekommunikationsanbieter, Finanzdienstleister oder Unternehmen anderer Branchen wechselwillige Kunden identifizieren und mittels neuer Angebote die Kundenbindung verbessern.“

Ein weiteres Beispiel sei die Anomalie-Erkennung zur Identifizierung von Ausreißern in sehr großen Datensätzen, die bei der Betrugserkennung, bei medizinischen Diagnosen und zur vorausschauenden Wartung (Predictive Maintenance) nutzbar sei. Zschaler: „Anwender können so in einem Bruchteil der sonst üblichen Zeit von der Idee zu einem voll funktionsfähigen ML-Anwendungsfall gelangen.“

2021 gab Cloudera die Integration des RAPIDS Accelerator für Apache Spark 3.0 in die Cloudera Data Platform bekannt. Ziel der Zusammenarbeit von Cloudera und Nvidia sei es dabei, Datenanalysen und KI in der Cloud zu beschleunigen. Daten- und ML-Workflows würden verbessert und Datenpipelines schneller abgearbeitet. Anwender der Lösung seien etwa die US-Finanzbehörde IRS und das Office for National Statistics UK. Die Einführung weiterer Angebote von Nvidia und Cloudera in CDP folgte.

Apropos Nachhaltigkeit und KI: „Das Analystenhaus PWC hat festgestellt, dass die Anwendung von Künstlicher Intelligenz die weltweiten Treibhausgas-Emissionen bis 2030 um 4 Prozent reduzieren kann“, so Alexander Zschaler in einem Blog.

CDP One bietet ZeroOps

CDP One biete die sogenannte ZeroOps-Funktionalität, die schnelle und einfache Self-Service-Analysen für jeden Datentyp ermögliche, ohne dass spezielle Fach- oder Cloud-Kenntnisse erforderlich seien. ZeroOps umfasst auch Security, Compliance und Governance.

Wie SecOps umgesetzt wird, erläutert Alexander Zschaler im Detail: „Da Cloudera die Sicherheit durchgängig verwaltet, wenn es die Plattform und die Infrastruktur betreibt, kann Cloudera die Netzwerk-, Perimeter- und Datensicherheit verwalten. Dabei kommen unter anderem Elemente wie Datenverschlüsselung, Compliance und Incidence Reports, Logmanagement und hostbasierte Sicherheitsfunktionen zum Einsatz. Das Identitätsmanagement, IAM, bietet eine zeit- und genehmigungsbasierte Rollenaktivierung, um die Risiken übermäßiger, unnötiger oder missbrauchter Zugriffsberechtigungen für kritische Ressourcen zu mindern.“

Für ZeroOps wird auch Machine Learning verwendet. „Die integrierten Sicherheitsmechanismen von CDP One sind speziell für Unternehmen ausgelegt“, so Zschaler. „Auch hier nutzen wir Maschinelles Lernen. Wir haben zudem ein engagiertes Team erfahrener Sicherheitsexperten, die die gehosteten CDP-One-Umgebungen unserer Kunden ständig überwachen, verbessern und sichern, um die Sicherheit der Daten zu gewährleisten. Somit fallen für Kunden keinerlei Cloud-bezogene, Sicherheits- oder Überwachungsaufgaben an.“

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

Cloudera verspricht aufgrund dieser Service-Funktionen eine Reduzierung der Gesamtbetriebskosten (TCO) „um 20 bis 35 Prozent im Vergleich zu anderen Cloud-Lösungen, wenn man die anfängliche Einrichtung und den Betrieb von Plattform, Sicherheit und Support mit einbezieht“, so der Hersteller.

Das Erbe von Hortonworks

„Als Teil der (seinerzeitigen) Fusionspläne zwischen Cloudera und Hortonworks begannen wir den Aufbau von Cloudera Data Platform (CDP) nach dem Designprinzip, also eine echte hybride Datenplattform“, berichtet Zschaler: „Eine Plattform, die einen vollständig integrierten, durchgängigen Datenlebenszyklus mit identischen Erfahrungen in Public und Private Clouds sowie einen gemeinsamen Rahmen für die Verwaltung von Sicherheit und Governance bietet.“ CDP beinhalte jeweils die besten Elemente der Hortonworks Data Platform und Cloudera Distributed Hadoop, kurz HDP, insbesondere Apache Ranger und „Atlas“ von HDP. Apache Ranger bietet laut Webseite eine umfassende Strategie für alle Sicherheitsaspekte in einem Hadoop-Cluster. Es bietet eine zentrale Plattform für die einheitliche Definition, Administration und Verwaltung von Sicherheitsrichtlinien für alle Hadoop-Komponenten.

Zschaler über den Erfolg: „Wir freuen uns, dass bereits mehr als 1.200 unserer Kunden zu CDP gewechselt haben. Sie nutzen unsere Data Fabric, unser Data Lakehouse und unser Data Mesh, um ihre Daten und Anwendungen sowohl über private als auch über öffentliche Formfaktoren zu verwalten. Alles beginnt mit der ,Unified Data Fabric‘ von CDP, die auf der Architektur Cloudera SDX basiert und alle unterschiedlichen Datenquellen intelligent, sicher und als Self-Service orchestriert.“ Dies biete einheitliche Sicherheit, Governance und Data-Lineage für alle Unternehmensdaten – unabhängig davon, ob sie sich vor Ort oder in unterschiedlichen Public Clouds befinden. „Diese Erfahrungen nutzen wir auch für die SaaS-Lösung CDP One.“

Bedeutung der Partner

Die Markteinführung von CDP One setzt die langjährige strategische Zusammenarbeit von Cloudera mit seinem Partner Talend fort. Mit Talends Tools für Data Preparation und Datenintegration sollen Kunden in der Lage sein, „qualitativ hochwertige und gut verwaltete Datenmanagement-Prozesse zu etablieren“, sagte Rolf Heimes, VP Global Channel & Alliances bei Talend. „Talend steuert als ISV die benutzerfreundliche Datenmanagement-Technologie bei“, ergänzt Alexander Zschaler. „In Kombination mit dem leistungsstarken Daten- und Analyseservice von Cloudera können Kunden so Daten besser nutzen.“

„Wir haben im November 2022 unser neues Partnerprogramm vorgestellt“, so Zschaler weiter. „Das Cloudera Partner Network belohnt Partner für ihren Beitrag zum Markterfolg von Cloudera. Mit unserem umfangreichen Partnernetzwerk erreichen wir neue Märkte und Kunden. Durch unsere Investitionen in Channel- und Allianzpartner können Unternehmen aus sämtlichen Branchen so über Daten hinaus ihr Geschäft beschleunigen.“

Neben Talend kooperiert Cloudera mit weiteren Technologiepartnern. „Wir arbeiten auch mit verschiedenen Partnern für verschiedene Technologien und Services zusammen. Partner sind ein großer Teil unseres Erfolgs, weil sie uns dabei helfen, die größten Probleme unserer Kunden besser zu lösen – Geschwindigkeit, Integration, Agilität und Kosten. Dazu zählen Hyperscaler und Cloud-Anbieter sowie Mitglieder der Open Source Community, Systemintegratoren und andere Partner.“

Verfügbarkeit & Support

CDP One ist momentan für angemeldete Kunden erhältlich und wird noch in diesem Jahr allgemein verfügbar sein. „CDP One wird in mehreren Regionen gehostet“, sagt Zschaler, „für den deutschsprachigen Raum und andere Regionen machen wir das momentan in Frankfurt/Main. Dazu nutzen wir Amazon Web Services (AWS). Wir arbeiten aber auch daran, den Service je nach Kundenwunsch bei weiteren Hyperscalern verfügbar zu machen.“

„Unser individuelles Account-Management erfasst und berücksichtigt den jeweiligen Bedarf“, so Zschaler weiter. „Dezidierte Account-Teams helfen den Unternehmen dabei, die Use Cases für die jeweilige Branche zu identifizieren. Unsere Professional-Service-Teams und Partner nehmen dann das Deployment vor.“

Cloudera bietet laut Zschaler ein Migration Acceleration Center als Teil seines Serviceangebots an, damit Kunden schnell und mit geringem Risiko in die Cloud wechseln können. „Der Service umfasst auch umfassende DevOps, SecOps und CloudOps, damit sich unsere Kunden auf ihre Daten und Analysen konzentrieren können, während wir ihre Umgebung, die Plattform und die Sicherheit verwalten.“ Zudem biete Cloudera Research Labs für Machine Learning an.

(ID:48764081)