Definition

Was ist Hortonworks?

| Autor / Redakteur: Tutanch / Nico Litzel

(Bild: © aga7ta - stock.adobe.com)

Hortonworks ist ein kalifornisches Softwareunternehmen, das auf die Entwicklung von Software rund um Apache Hadoop spezialisiert ist. Für Big-Data-Anwendungen bietet Hortonworks eine eigene Hadoop-Distribution unter dem Namen Hortonworks Data Platform (HDP) an.

Das 2011 gegründete Softwareunternehmen Hortonworks ist im kalifornischen Santa Clara angesiedelt und entstand aus einer Ausgründung von Yahoo. Der Name Hortonworks geht auf den Elefanten aus dem Kinderbuchklassiker „Horten Hears a Who“ zurück. Mittlerweile ist Hortonworks an der NASDAQ gelistet.

Das Unternehmen hat sich auf Softwareentwicklungen rund um Apache Hadoop und weiteren zugehörigen Apache-Projekten spezialisiert. Hortonworks veranstaltet Entwicklerkonferenzen wie den Hadoop Summit. Unter dem Namen Hortonworks Data Platform (HDP) ist eine auf Open Source basierende Hadoop-Distribution erhältlich, zu der zahlreiche Erweiterungen existieren. HDP integriert Hadoop und besitzt als Kernkomponenten das Hadoop Distributed File System (HDFS) und MapReduce. Weitere Komponenten der Distribution sind beispielsweise HBase, Hive und Zookeeper. Mithilfe von HDP lassen sich große Datenmengen speichern, analysieren und prozessieren. Daher ist die Hortonworks Data Platform für Big-Data-Anwendungen einsetzbar.

Die Hortonworks Data Platform

Mit der Hortonworks Data Platform ist Hortonworks eine treibende Kraft für freie Apache-Hadoop-Projekte. Bei HDP handelt es sich um eine hundertprozentig quelloffene Distribution von Hadoop, die direkt von der Projektseite von Hortonworks heruntergeladen werden kann. HDP ist darüber hinaus als vorkonfigurierte virtuelle Umgebung in Form einer HDP-Sandbox für Hyper-V, VMware, Docker oder VirtualBox erhältlich.

Die Hortonworks Data Platform besitzt eine sehr große Nähe zum Hadoop-Projekt und den dort verwendeten Standards. Sie integriert verschiedene Open-Source-Projekte und versteht sich als Ergänzung konventioneller Datenhaltung. Optionale Add-ons und Komponenten von anderen Herstellern ergänzen die Hortonworks Data Platform.

Zentrale Eigenschaften und Vorteile

Die wichtigsten Komponenten der Hortonworks Data Platform sind das Hadoop Distributed File System (HDFS) und YARN. Um große Datenmengen skalierbar, sicher und effizient zu speichern, stellt das Hadoop Distributed File System (HDFS) zahlreiche Funktionen zur Verfügung. YARN sorgt für die benötigte Architektur und bietet eine hohe Flexibilität für den Zugriff auf die Daten über unterschiedliche Prozeduren. Auf der Speicherarchitektur lassen sich Workloads parallel verarbeiten.

YARN kann zudem Cluster-weite Services für den Betrieb, Daten-Governance und Sicherheit koordinieren. Der komplette Ansatz von Hortonworks ist zu hundert Prozent quelloffen. Dadurch ermöglicht HDP den Unternehmen eine einfache Integration in ihre IT-Landschaft und verhindert proprietäre Insellösungen. Sowohl strukturierte Daten als auch unstrukturierte Daten lassen sich mit der Plattform prozessieren.

Interoperabilität

Ein der großen Stärken der Hortonworks Data Platform ist ihre Interoperabilität mit vielen anderen Ökosystemen und Cloud-Plattformen. Der quelloffene Ansatz und die vielfältige Kompatibilität schützen die Investitionen in vorhandene IT-Infrastrukturen und ermöglichen einen kostengünstigen Einstieg in Hadoop-basierte Big-Data-Anwendungen.

Die Vorteile von HDP sind unter anderem:

  • Vollständig quelloffen,
  • hohe Performance und Innovationsfähigkeit,
  • sehr gute Eignung für Unternehmen und
  • eine benutzerfreundliche Administration.

Mit der aktuellsten Version der Hortonworks Data Platform erhalten Anwender Zugang zu neuesten Funktionen der Datenforschung und eine umfangreiche Unterstützung von maschinenbasierten Lernalgorithmen. Trotz großer Datenmengen lassen sich Abfrageleistungen für Business Intelligence Tools mit minimalen Antwortzeiten realisieren. Das Speichern und Replizieren von Daten zu Analysezwecken in einer SQL-Datenbank kann vollständig entfallen.

Mithilfe fein abgestufter Datenzugriffskontrollen auf allen Ebenen des Hadoop-Stacks sind die Sicherheitsanforderungen und Data-Compliance-Richtlinien von Unternehmen leicht einzuhalten. Sicherheitsregeln können einfach im Paket von einer Umgebung in eine andere importiert und exportiert werden.

Weitere Produkte und Lösungen von Hortonworks

Neben der Hortonworks Data Platform bietet das Unternehmen weitere Produkte und Lösungen rund um die Verarbeitung von großen Datenmengen für Big-Data-Anwendungen an. Als Lösung für Rechenzentren ist die Kombination von Hortonworks DataFlow und der Hortonworks Data Platform gedacht. Hortonworks DataFlow erfasst, organisiert und analysiert Daten in Echtzeit und liefert sie an die Hortonworks Data Platform. Mögliche Anwendung für Hortonworks DataFlow ist das „Internet of Anything“ (IoAT) mit seiner Vielzahl an Geräten, Sensoren und bereitgestellten Daten.

Für die Bereitstellung eine Hortonworks Connected Data Platform in der Cloud stehen ebenfalls Lösungen zur Verfügung. So lassen sich mit den Hortonworks Cloud Solutions vernetzte Datenarchitekturen komplett in die Cloud verlagern. Microsoft Azure HDInsight stellt eine Premium-Cloud-Lösung von Hortonworks dar. Als anwenderfreundlicher und kostengünstiger Cloud-Service für unterschiedliche Anwendungen im Big-Data-Umfeld ist Hortonworks Data Cloud für Amazon Web Services konzipiert. Er wird über den AWS Marketplace bereitgestellt und basiert auf der Hortonworks Data Platform.

Als ein weiterer Teil der Hortonworks Data Platform ermöglicht Cloudbreak, Daten-Cluster in der Cloud bereitzustellen. Cloudbreak ist ein Tool für die Konfiguration von Hadoop Clustern in einer Cloud-Infrastruktur wie Amazon Web Services oder Microsoft Azure.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Aktuelle Beiträge zu diesem Thema

Cloudera und Hortonworks schließen Fusion ab

Zusammenschluss vollzogen

Cloudera und Hortonworks schließen Fusion ab

Die beiden Datenspezialisten Cloudera und Hortonworks haben ihre Fusion erfolgreich vollzogen. Gemeinsam wollen die Unternehmen eine Enterprise Data Cloud vom Edge bis hin zu Künstlicher Intelligenz (KI) entwickeln. lesen

Das sind die Trends 2019

Kommentar von Arun C. Murthy, Hortonworks

Das sind die Trends 2019

Was bringt das Jahr 2019 im Bereich Big Data und Künstliche Intelligenz? Eine Einschätzung dazu gibt Arun C. Murthy, Co-Founder und Chief Product Officer bei Hortonworks. lesen

Apache Kafka – von Big zu Fast Data

Open-Source-Streaming-Plattform

Apache Kafka – von Big zu Fast Data

Die verteilte Streaming-Plattform Apache Kafka wurde für ein schnelles Verarbeiten und Speichern von Billionen von Datenströmen pro Tag entwickelt. Gleichzeitig stellt sie eine Schnittstelle zum Laden und Exportieren von Datenströmen zu Drittsystemen bereit. lesen

Globales Datenmanagement für die digitale Transformation

Kommentar von Daniel Metzger, Hortonworks

Globales Datenmanagement für die digitale Transformation

Produkte und Nutzererfahrung optimieren, die Effizienz der Geschäftsaktivitäten steigern und den Gewinn maximieren – das ist die Essenz der Digitalisierung. Der gesamte Treibstoff all dieser Aktionen liegt in den Daten. Bei genauerer Betrachtung ist das alles aber gar nicht erst seit kurzem der Fall: Die digitale Transformation beschäftigt Unternehmen weltweit seit nunmehr etwa 20 Jahren lesen

Cloudera und Hortonworks fusionieren

Big-Data-Zusammenschluss

Cloudera und Hortonworks fusionieren

Die beiden Big-Data-Spezialisten Cloudera und Hortonworks haben ihre Fusion bekanntgegeben. Gemeinsam unter einem Dach will man die führende Datenplattform der nächsten Generation entwickeln und eine Enterprise Data Cloud auf den Markt bringen. lesen

Open-Hybrid-Architecture-Initiative gestartet

Hortonworks, IBM und Red Hat

Open-Hybrid-Architecture-Initiative gestartet

Gemeinsam wollen Hortonworks, IBM und Red Hat die Containerisierung von Big-Data-Workloads für hybride Architekturen vorantreiben. Dazu wurden die Hortonworks Data Platform, DataFlow, DataPlane und die IBM Cloud Private for Data für Red Hat OpenShift optimiert. lesen

Cisco stellt Server für KI- und ML-Workloads vor

Beschleunigtes Deep Learning

Cisco stellt Server für KI- und ML-Workloads vor

Mit dem neuen UCS-Server („Unified Computing System“) C480 ML M5 will Cisco Deep-Learning-Projekte auf Trab bringen. Das System wurde speziell für die Verarbeitung von KI- und Machine-Learning-Workloads (ML) entwickelt. lesen

Hortonworks stellt Streams Messaging Manager vor

Für Kafka-Umgebungen

Hortonworks stellt Streams Messaging Manager vor

Parallel zur Veröffentlichung eines Updates für „Dataflow“ hat Hortonworks den „Streams Messaging Manager“ präsentiert. Die Monitoring-Plattform soll „Kafka“-Nutzern die Arbeit erleichtern. lesen

Die fünf größten BI-Irrtümer – und wie es wirklich aussieht

Kommentar von Robert Schmitz, Qlik

Die fünf größten BI-Irrtümer – und wie es wirklich aussieht

Daten: das „Gold des 21. Jahrhunderts“ – wirklich? Kommt darauf, denkt vielleicht mancher CEO oder CIO und stellt sich mit gemischten Gefühlen die Datensilos, die jahrelang eingefahrenen Reporting-Prozesse oder die großen Unterschiede zwischen den Fachabteilungen in seiner Organisation vor. Wo anfangen mit einer echten Datenstrategie, die auch Mehrwert generiert und nicht nur Ressourcen frisst? Wer soll den Data Lake überhaupt noch durchdringen, der in immer kürzeren Intervallen immer größer wird? lesen

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 44775753 / Definitionen)