Suchen

Definition Was ist Hortonworks?

| Autor / Redakteur: Tutanch / Nico Litzel

Hortonworks ist ein kalifornisches Softwareunternehmen, das auf die Entwicklung von Software rund um Apache Hadoop spezialisiert ist. Für Big-Data-Anwendungen bietet Hortonworks eine eigene Hadoop-Distribution unter dem Namen Hortonworks Data Platform (HDP) an.

Firmen zum Thema

(Bild: © aga7ta - stock.adobe.com )

Das 2011 gegründete Softwareunternehmen Hortonworks ist im kalifornischen Santa Clara angesiedelt und entstand aus einer Ausgründung von Yahoo. Der Name Hortonworks geht auf den Elefanten aus dem Kinderbuchklassiker „Horten Hears a Who“ zurück. Mittlerweile ist Hortonworks an der NASDAQ gelistet.

Das Unternehmen hat sich auf Softwareentwicklungen rund um Apache Hadoop und weiteren zugehörigen Apache-Projekten spezialisiert. Hortonworks veranstaltet Entwicklerkonferenzen wie den Hadoop Summit. Unter dem Namen Hortonworks Data Platform (HDP) ist eine auf Open Source basierende Hadoop-Distribution erhältlich, zu der zahlreiche Erweiterungen existieren. HDP integriert Hadoop und besitzt als Kernkomponenten das Hadoop Distributed File System (HDFS) und MapReduce. Weitere Komponenten der Distribution sind beispielsweise HBase, Hive und Zookeeper. Mithilfe von HDP lassen sich große Datenmengen speichern, analysieren und prozessieren. Daher ist die Hortonworks Data Platform für Big-Data-Anwendungen einsetzbar.

Die Hortonworks Data Platform

Mit der Hortonworks Data Platform ist Hortonworks eine treibende Kraft für freie Apache-Hadoop-Projekte. Bei HDP handelt es sich um eine hundertprozentig quelloffene Distribution von Hadoop, die direkt von der Projektseite von Hortonworks heruntergeladen werden kann. HDP ist darüber hinaus als vorkonfigurierte virtuelle Umgebung in Form einer HDP-Sandbox für Hyper-V, VMware, Docker oder VirtualBox erhältlich.

Die Hortonworks Data Platform besitzt eine sehr große Nähe zum Hadoop-Projekt und den dort verwendeten Standards. Sie integriert verschiedene Open-Source-Projekte und versteht sich als Ergänzung konventioneller Datenhaltung. Optionale Add-ons und Komponenten von anderen Herstellern ergänzen die Hortonworks Data Platform.

Zentrale Eigenschaften und Vorteile

Die wichtigsten Komponenten der Hortonworks Data Platform sind das Hadoop Distributed File System (HDFS) und YARN. Um große Datenmengen skalierbar, sicher und effizient zu speichern, stellt das Hadoop Distributed File System (HDFS) zahlreiche Funktionen zur Verfügung. YARN sorgt für die benötigte Architektur und bietet eine hohe Flexibilität für den Zugriff auf die Daten über unterschiedliche Prozeduren. Auf der Speicherarchitektur lassen sich Workloads parallel verarbeiten.

YARN kann zudem Cluster-weite Services für den Betrieb, Daten-Governance und Sicherheit koordinieren. Der komplette Ansatz von Hortonworks ist zu hundert Prozent quelloffen. Dadurch ermöglicht HDP den Unternehmen eine einfache Integration in ihre IT-Landschaft und verhindert proprietäre Insellösungen. Sowohl strukturierte Daten als auch unstrukturierte Daten lassen sich mit der Plattform prozessieren.

Interoperabilität

Ein der großen Stärken der Hortonworks Data Platform ist ihre Interoperabilität mit vielen anderen Ökosystemen und Cloud-Plattformen. Der quelloffene Ansatz und die vielfältige Kompatibilität schützen die Investitionen in vorhandene IT-Infrastrukturen und ermöglichen einen kostengünstigen Einstieg in Hadoop-basierte Big-Data-Anwendungen.

Die Vorteile von HDP sind unter anderem:

  • Vollständig quelloffen,
  • hohe Performance und Innovationsfähigkeit,
  • sehr gute Eignung für Unternehmen und
  • eine benutzerfreundliche Administration.

Mit der aktuellsten Version der Hortonworks Data Platform erhalten Anwender Zugang zu neuesten Funktionen der Datenforschung und eine umfangreiche Unterstützung von maschinenbasierten Lernalgorithmen. Trotz großer Datenmengen lassen sich Abfrageleistungen für Business Intelligence Tools mit minimalen Antwortzeiten realisieren. Das Speichern und Replizieren von Daten zu Analysezwecken in einer SQL-Datenbank kann vollständig entfallen.

Mithilfe fein abgestufter Datenzugriffskontrollen auf allen Ebenen des Hadoop-Stacks sind die Sicherheitsanforderungen und Data-Compliance-Richtlinien von Unternehmen leicht einzuhalten. Sicherheitsregeln können einfach im Paket von einer Umgebung in eine andere importiert und exportiert werden.

Weitere Produkte und Lösungen von Hortonworks

Neben der Hortonworks Data Platform bietet das Unternehmen weitere Produkte und Lösungen rund um die Verarbeitung von großen Datenmengen für Big-Data-Anwendungen an. Als Lösung für Rechenzentren ist die Kombination von Hortonworks DataFlow und der Hortonworks Data Platform gedacht. Hortonworks DataFlow erfasst, organisiert und analysiert Daten in Echtzeit und liefert sie an die Hortonworks Data Platform. Mögliche Anwendung für Hortonworks DataFlow ist das „Internet of Anything“ (IoAT) mit seiner Vielzahl an Geräten, Sensoren und bereitgestellten Daten.

Für die Bereitstellung eine Hortonworks Connected Data Platform in der Cloud stehen ebenfalls Lösungen zur Verfügung. So lassen sich mit den Hortonworks Cloud Solutions vernetzte Datenarchitekturen komplett in die Cloud verlagern. Microsoft Azure HDInsight stellt eine Premium-Cloud-Lösung von Hortonworks dar. Als anwenderfreundlicher und kostengünstiger Cloud-Service für unterschiedliche Anwendungen im Big-Data-Umfeld ist Hortonworks Data Cloud für Amazon Web Services konzipiert. Er wird über den AWS Marketplace bereitgestellt und basiert auf der Hortonworks Data Platform.

Als ein weiterer Teil der Hortonworks Data Platform ermöglicht Cloudbreak, Daten-Cluster in der Cloud bereitzustellen. Cloudbreak ist ein Tool für die Konfiguration von Hadoop Clustern in einer Cloud-Infrastruktur wie Amazon Web Services oder Microsoft Azure.

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de (ID: 44775753)