Definition Was ist Cloudera?

Anbieter zum Thema

Cloudera ist ein US-Softwareunternehmen aus dem Big-Data-Umfeld. Es bietet Lösungen und Produkte für die datengetriebene digitale Transformation und die Bewältigung und Analyse großer Datenmengen. Basis bildet eine hybride Datenplattform mit einheitlicher Data Fabric, skalierbarem Data Mesh und offenen Data Lakehouse. 2022 brachte Cloudera die Data Platform (CDP) One für schnelle und einfache Self-Service-Analysen und explorative Datenanalysen als SaaS-Angebot auf den Markt.

(Bild: © aga7ta - stock.adobe.com)

Cloudera ist ein im Jahr 2008 im kalifornischen Palo Alto gegründetes US-Unternehmen. In den Anfängen konzentrierte sich Cloudera auf Software rund um Apache Hadoop. Schon 2009 erschien die erste Hadoop-Distribution von Cloudera. Bestandteile der Hadoop-Distribution CDH (Cloudera‘s Distribution Including Apache Hadoop) sind heute neben dem Hadoop Distributed File System (HDFS) und MapReduce zahlreiche weitere Open-Source-Projekte für Ende-zu-Ende-Big-Data-Workflows wie Apache Accumulo, Apache Flume, Apache HBase, Apache Hive, HUE, Apache Impala, Apache Kafka, Apache Pig, Apache Sentry, Cloudera Search, Apache Spark und Apache Sqoop. Die Distribution von Cloudera zählt weltweit zu den bekanntesten Distributionen von Apache Hadoop und ermöglicht den Einsatz im Bereich des High Performance Computings (HPC) und der Big-Data-Anwendungen. Die Distribution lässt sich nutzen, wenn sehr große Datenbestände analysiert und verarbeitet werden müssen.

In der Firmengeschichte von Cloudera gab es bereits mehrere Merger und Übernahmen. 2018 fusionierte Cloudera mit Hortonworks. 2021 erfolgten Übernahmen von Datacoral und Cazena.

Cloudera bietet heute Lösungen und Produkte für die datengetriebene digitale Transformation und die Bewältigung großer Datenmengen sowie deren Auswertung wie eine hybride Datenplattform mit einheitlicher Data Fabric, skalierbarem Data Mesh und offenen Data Lakehouse für sicheres Datenmanagement und Cloud-native Datenanalysen. Die Datenplattform bezieht öffentliche Cloud-Plattformen wie Microsoft Azure, Amazon Web Services (AWS) und Google Cloud Platform (GCP) sowie private Cloud-Services mit ein. 2022 brachte Cloudera mit der Data Platform (CDP) One einen umfassenden Data-Lakehouse-Cloudservice für schnelle und einfache Self-Service-Analysen und explorative Datenanalysen als SaaS-Angebot auf den Markt.

Die Lösungen von Cloudera sind für verschiedene Bereiche und Branchen wie das Finanzwesen, Gesundheitswesen, Bildungswesen, Forschung, Versicherungen, Telekommunikation, Einzelhandel, Energie- und Versorgungsbetriebe, für den öffentlichen Sektor, in Produktionsbetrieben und für vieles mehr einsetzbar. Weltweit vertrauen mittlerweile viele namhafte Kunden wie HelloFresh, Commerzbank, New Yorker, Vodafone, Morgan Stanley, Deutsche Telekom, Santander, Master Card und andere auf Produkte von Cloudera.

Die hybride Datenplattform CDP (Cloudera Data Platform)

Die Cloudera Data Platform, abgekürzt CDP, ist eine hybride Datenplattform und bietet alle Bausteine für moderne Datenarchitekturen. Daten lassen sich zwischen öffentlichen und privaten Clouds bewegen. Die Cloudera Data Platform ist für die Verwaltung und Analyse von Daten aller Art (strukturiert und unstrukturiert) über ihren kompletten Lebenszyklus in lokalen Rechenzentren, öffentlichen Cloud-Plattformen und am Edge einsetzbar. Unterstützt werden die Cloud-Plattformen Microsoft Azure, Amazon Web Services und Google Cloud Platform (GCP). Eine einheitliche Data Fabric, ein offenes Data Lakehouse und ein skalierbares Data Mesh ermöglichen ein integriertes System mit gemeinsamen Sicherheits-, Governance-, Replikations-, Automatisierungs- und Metadatenfunktionen. Einmal erstellter Code ist überall einsetzbar. Die Cloudera Data Platform zeichnet sich durch eine einfache und schnelle Verwaltung und Analyse von Daten aus unterschiedlichsten Quellen sowie eine hohe Performance, Sicherheit und Skalierbarkeit aus.

Cloudera Data Platform One (CDP One)

Cloudera brachte 2022 die Cloudera Data Platform One (CDP One) auf den Markt. Es handelt sich um einen umfassenden Data-Lakehouse-Cloudservice für alle Arten von Daten aus beliebigen Quellen. Das SaaS-Angebot bietet als schlüsselfertiger Dienst einfache Self-Service-Analysen und explorative Data Science. Der Service integriert unter anderem Sicherheitsmechanismen auf Unternehmensniveau und maschinelles Lernen. Mit CDP One möchte Cloudera die Produktivität der Entwickler, Datenexperten und Low-Code-Analysten steigern. Spezialisierte Operations- und Cloud-Teams werden für die Analysen nicht benötigt.

Beispiele für einige interessante Aktivitäten von Cloudera

In Pressemitteilungen ist regelmäßig von interessanten Aktivitäten des Unternehmens zu lesen. Im Folgenden kurze Beschreibungen zweier exemplarischer Beispiele solcher Aktivitäten.

2021 gab Cloudera die Integration des RAPIDS Accelerator für Apache Spark 3.0 in die Cloudera Data Platform bekannt. Ziel der Zusammenarbeit von Cloudera und NVIDIA ist es, Datenanalysen und Künstliche Intelligenz in der Cloud zu beschleunigen. Daten- und Machine-Learning-Workflows werden verbessert und Datenpipelines schneller abgearbeitet. Anwender der Lösung sind zum Beispiel die US-amerikanische Finanzbehörde Internal Revenue Service (IRS) und das Office for National Statistics UK. Die Einführung weiterer Angebote von NVIDIA und Cloudera in CDP folgte.

2022 veröffentlichte Cloudera in Zusammenarbeit mit der ReadyAI ein Buch für die digitale Medienerziehung von Kindern. Es trägt den Titel „Clara, Alex und die Daten“ und soll Kindern ab acht Jahren das Thema Künstliche Intelligenz anschaulich und einfach erklären. Eine Intention des Buches ist es, die digitalen Fähigkeiten von Kindern und Jugendlichen zu verbessern und deren Datenkompetenz zu fördern.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

(ID:44757420)