Definition Was ist Hortonworks?

Anbieter zum Thema

Hortonworks war ein kalifornisches Softwareunternehmen, das auf die Entwicklung von Open Source Software und Big-Data-Anwendungen rund um Apache Hadoop spezialisiert war. Das Unternehmen stellte unter anderem die Hortonworks Data Platform (HDP) zur Verfügung. 2019 fusionierten Hortonworks und Cloudera zu einem gemeinsamen Unternehmen, das sich selbst als Enterprise Data Cloud Company bezeichnet. Das Kernprodukt von Cloudera ist die hybride Cloudera Data Platform (CDP).

(Bild: © aga7ta - stock.adobe.com)

Hortonworks entstand 2011 aus einer Ausgründung von Yahoo und hatte seinen Sitz im kalifornischen Santa Clara. Der Name Hortonworks leitet sich vom 1954 entstandenen und mittlerweile mehrfach verfilmten Kinderbuchklassiker „Horton Hears a Who“ ab. Horton ist der Name des Elefanten aus dem Kinderbuch. 2019 fusionierte Hortonworks mit Cloudera zu einem gemeinsamen Unternehmen, das seither nur noch unter dem Namen Cloudera auftritt.

Hortonworks war auf die Entwicklung von Software rund um das Framework Apache Hadoop und zugehörige Apache-Projekte spezialisiert. Das Logo von Apache Hadoop zeigt ebenfalls einen Elefanten. Zu den wichtigsten von Hortonworks angebotenen Lösungen gehörte die Hortonworks Data Platform (HDP), eine Open-Source-basierte Hadoop-Distribution. Mit HDP war es möglich, große Datenmengen zu speichern, auszuwerten und zu verarbeiten. Die Plattform unterstützte zahlreiche Big-Data-Anwendungsszenarien und enthielt Komponenten wie das Hadoop Distributed File System (HDFS), MapReduce, HBase, Hive und Zookeeper. Weitere Lösungen und Produkte von Hortonworks waren DataFlow für IT-Anwendungen, Hortonworks Cloud Solutions, Hortonworks DataPlane Services (DPS) mit Cloudbreak und andere.

Seit der Fusion mit Cloudera ist die hybride Datenplattform Cloudera Data Platform (CDP) das Kernprodukt des Unternehmens. Produkte und Lösungen von Hortonworks wurden zu Bestandteilen der Cloudera Data Platform.

Der Merger von Hortonworks und Cloudera

Im Oktober 2018 gaben Cloudera und Hortonworks bekannt, dass sie zu einem gemeinsamen Unternehmen fusionieren möchten. Ziel der Fusion war es, unter einem gemeinsamen Dach eine führende Datenplattform zu entwickeln und eine hybride Enterprise Data Cloud auf den Markt zu bringen. Unter dem Namen Cloudera sollte ein weltweit führender Data-Platform-Anbieter mit Lösungen für den On-Premises-, Multi-Cloud- und Edge-Bereich entstehen. Weiteres Ziel der Fusion war die Etablierung eines Industriestandards für das Hybrid-Cloud-Data-Management.

Im Zuge des Mergers erhielten Aktionäre von Hortonworks für jede Hortonworks-Aktie 1,305 Stammaktien von Cloudera. Cloudera-Aktien werden an der New York Stock Exchange gehandelt. 2019 erfolgte die Meldung, dass die Fusion von Hortonworks und Cloudera erfolgreich vollzogen wurde. Cloudera und Hortonworks traten im gleichen Jahr erstmals gemeinsam auf der DataWorks-Konferenz in Barcelona auf. Die ehemalige Internetseite von Hortonworks hortonworks.com zeigt mittlerweile keinen eigenen Internetauftritt mehr an, sondern ist auf cloudera.com umgeleitet. Als ein Ergebnis der Fusion entstand aus der Hortonworks Data Platform (HDP) und der Cloudera Distribution of Hadoop (CDH) die neue Open-Source-basierte Cloudera Data Platform (CDP). Sie unterstützt sowohl hybride als auch Multi-Cloud-Deployments.

Merkmale und Eigenschaften der Cloudera Data Platform

Die Cloudera Data Platform ist eine hybride Datenplattform und soll das Potenzial privater und öffentlicher Clouds erschließen. Sie basiert auf einer modernen Datenarchitektur und enthält eine Vielzahl von Frameworks zur Analyse und Verarbeitung von Daten wie DataFlow, Stream Processing, Data Engineering, Data Warehouse, Operational Database, Machine Learning und Data Hub. Mit DataFlow lassen sich Daten einfach und sicher erfassen und zwischen beliebigen Orten verschieben. Stream Processing ermöglicht die Verarbeitung von Datenströmen in Echtzeit.

Um komplexe Datenpipelines zu orchestrieren, zu operationalisieren und zu automatisieren, kommt Data Engineering zum Einsatz. Das Data Warehouse vereinfacht Analysen großer Datenmengen und eignet sich für viele gleichzeitige Benutzer. Die Operational Database bietet eine enorme Skalierbarkeit und ist für verschiedene Datenmodelle geeignet. Machine Learning mit Self-Service-Arbeitsbereichen und Rechen-Clustern beschleunigt die Arbeit mit den Daten. Mit dem Analysedienst Data Hub vereinfacht sich die Entwicklung datengestützter Anwendungen. Sicherheit, Governance, Skalierung und Kontrolle auf Unternehmensebene werden unterstützt.

Eine Kernkomponente der Cloudera Data Plattform ist Cloudera SDX (Shared Data Experience). Cloudera SDX sorgt mit einheitlichen Richtlinien für eine durchgängige Sicherheit und Governance auf Unternehmensniveau. Datenkatalog und gemeinsame Metadaten kombiniert mit zentralen Verwaltungs-, Sicherheits- und Gouvernancefunktionen bieten zahlreiche Vorteile. Datensilos werden vermieden, Ressourcenkonflikte bereinigt und Abhängigkeiten von proprietären Formaten unterbunden.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

Daten und KI-gestützte Anwendungen sind mit der hybriden Enterprise Data Cloud überall flexibel in eigenen Rechenzentren und in Daten-Clouds nutzbar. Services verschiedener Bereiche wie Datenmanagement, Datenanalyse, Transaktionen und Date Science werden in öffentlichen und privaten Clouds zugänglich. CDP Public Cloud bietet die Möglichkeit, von den Leistungen der Datenplattform zu profitieren, ohne die Software selbst installieren und verwalten zu müssen. Cloudera managt die CDP Public Cloud Services. CDP steht in AWS, Microsoft Azure und in der Google Cloud zur Verfügung.

Anwender der Hortonworks Data Platform oder der Cloudera Distribution of Hadoop können einen Upgrade auf die Cloudera Data Platform durchführen. Um von CDH- oder HDP-Clustern zur Cloudera Data Platform zu migrieren, stehen verschiedene Tutorials und Migrationsmethoden zur Verfügung. Die Migration beinhaltet die vorhandenen Anwendungen, Daten und die Hardware.

(ID:44775753)