Definition

Was ist Hortonworks?

| Autor / Redakteur: Tutanch / Nico Litzel

(Bild: © aga7ta - stock.adobe.com)

Hortonworks ist ein kalifornisches Softwareunternehmen, das auf die Entwicklung von Software rund um Apache Hadoop spezialisiert ist. Für Big-Data-Anwendungen bietet Hortonworks eine eigene Hadoop-Distribution unter dem Namen Hortonworks Data Platform (HDP) an.

Das 2011 gegründete Softwareunternehmen Hortonworks ist im kalifornischen Santa Clara angesiedelt und entstand aus einer Ausgründung von Yahoo. Der Name Hortonworks geht auf den Elefanten aus dem Kinderbuchklassiker „Horten Hears a Who“ zurück. Mittlerweile ist Hortonworks an der NASDAQ gelistet.

Das Unternehmen hat sich auf Softwareentwicklungen rund um Apache Hadoop und weiteren zugehörigen Apache-Projekten spezialisiert. Hortonworks veranstaltet Entwicklerkonferenzen wie den Hadoop Summit. Unter dem Namen Hortonworks Data Platform (HDP) ist eine auf Open Source basierende Hadoop-Distribution erhältlich, zu der zahlreiche Erweiterungen existieren. HDP integriert Hadoop und besitzt als Kernkomponenten das Hadoop Distributed File System (HDFS) und MapReduce. Weitere Komponenten der Distribution sind beispielsweise HBase, Hive und Zookeeper. Mithilfe von HDP lassen sich große Datenmengen speichern, analysieren und prozessieren. Daher ist die Hortonworks Data Platform für Big-Data-Anwendungen einsetzbar.

Die Hortonworks Data Platform

Mit der Hortonworks Data Platform ist Hortonworks eine treibende Kraft für freie Apache-Hadoop-Projekte. Bei HDP handelt es sich um eine hundertprozentig quelloffene Distribution von Hadoop, die direkt von der Projektseite von Hortonworks heruntergeladen werden kann. HDP ist darüber hinaus als vorkonfigurierte virtuelle Umgebung in Form einer HDP-Sandbox für Hyper-V, VMware, Docker oder VirtualBox erhältlich.

Die Hortonworks Data Platform besitzt eine sehr große Nähe zum Hadoop-Projekt und den dort verwendeten Standards. Sie integriert verschiedene Open-Source-Projekte und versteht sich als Ergänzung konventioneller Datenhaltung. Optionale Add-ons und Komponenten von anderen Herstellern ergänzen die Hortonworks Data Platform.

Zentrale Eigenschaften und Vorteile

Die wichtigsten Komponenten der Hortonworks Data Platform sind das Hadoop Distributed File System (HDFS) und YARN. Um große Datenmengen skalierbar, sicher und effizient zu speichern, stellt das Hadoop Distributed File System (HDFS) zahlreiche Funktionen zur Verfügung. YARN sorgt für die benötigte Architektur und bietet eine hohe Flexibilität für den Zugriff auf die Daten über unterschiedliche Prozeduren. Auf der Speicherarchitektur lassen sich Workloads parallel verarbeiten.

YARN kann zudem Cluster-weite Services für den Betrieb, Daten-Governance und Sicherheit koordinieren. Der komplette Ansatz von Hortonworks ist zu hundert Prozent quelloffen. Dadurch ermöglicht HDP den Unternehmen eine einfache Integration in ihre IT-Landschaft und verhindert proprietäre Insellösungen. Sowohl strukturierte Daten als auch unstrukturierte Daten lassen sich mit der Plattform prozessieren.

Interoperabilität

Ein der großen Stärken der Hortonworks Data Platform ist ihre Interoperabilität mit vielen anderen Ökosystemen und Cloud-Plattformen. Der quelloffene Ansatz und die vielfältige Kompatibilität schützen die Investitionen in vorhandene IT-Infrastrukturen und ermöglichen einen kostengünstigen Einstieg in Hadoop-basierte Big-Data-Anwendungen.

Die Vorteile von HDP sind unter anderem:

  • Vollständig quelloffen,
  • hohe Performance und Innovationsfähigkeit,
  • sehr gute Eignung für Unternehmen und
  • eine benutzerfreundliche Administration.

Mit der aktuellsten Version der Hortonworks Data Platform erhalten Anwender Zugang zu neuesten Funktionen der Datenforschung und eine umfangreiche Unterstützung von maschinenbasierten Lernalgorithmen. Trotz großer Datenmengen lassen sich Abfrageleistungen für Business Intelligence Tools mit minimalen Antwortzeiten realisieren. Das Speichern und Replizieren von Daten zu Analysezwecken in einer SQL-Datenbank kann vollständig entfallen.

Mithilfe fein abgestufter Datenzugriffskontrollen auf allen Ebenen des Hadoop-Stacks sind die Sicherheitsanforderungen und Data-Compliance-Richtlinien von Unternehmen leicht einzuhalten. Sicherheitsregeln können einfach im Paket von einer Umgebung in eine andere importiert und exportiert werden.

Weitere Produkte und Lösungen von Hortonworks

Neben der Hortonworks Data Platform bietet das Unternehmen weitere Produkte und Lösungen rund um die Verarbeitung von großen Datenmengen für Big-Data-Anwendungen an. Als Lösung für Rechenzentren ist die Kombination von Hortonworks DataFlow und der Hortonworks Data Platform gedacht. Hortonworks DataFlow erfasst, organisiert und analysiert Daten in Echtzeit und liefert sie an die Hortonworks Data Platform. Mögliche Anwendung für Hortonworks DataFlow ist das „Internet of Anything“ (IoAT) mit seiner Vielzahl an Geräten, Sensoren und bereitgestellten Daten.

Für die Bereitstellung eine Hortonworks Connected Data Platform in der Cloud stehen ebenfalls Lösungen zur Verfügung. So lassen sich mit den Hortonworks Cloud Solutions vernetzte Datenarchitekturen komplett in die Cloud verlagern. Microsoft Azure HDInsight stellt eine Premium-Cloud-Lösung von Hortonworks dar. Als anwenderfreundlicher und kostengünstiger Cloud-Service für unterschiedliche Anwendungen im Big-Data-Umfeld ist Hortonworks Data Cloud für Amazon Web Services konzipiert. Er wird über den AWS Marketplace bereitgestellt und basiert auf der Hortonworks Data Platform.

Als ein weiterer Teil der Hortonworks Data Platform ermöglicht Cloudbreak, Daten-Cluster in der Cloud bereitzustellen. Cloudbreak ist ein Tool für die Konfiguration von Hadoop Clustern in einer Cloud-Infrastruktur wie Amazon Web Services oder Microsoft Azure.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Aktuelle Beiträge zu diesem Thema

Wie die Cloud hilft, den Bierabsatz zu optimieren

Data Lake in Azure-Cloud beschleunigt Entscheidungsfindung bei AB InBev

Wie die Cloud hilft, den Bierabsatz zu optimieren

Bei der Brauereigruppe AB InBev verbrachten einzelne Mitarbeiter früher bis zu 80 Prozent ihrer Zeit damit, relevante Daten zu identifizieren und aufzubereiten. Über eine zentrale Cloud-Lösung werden heute Daten schneller bereitgestellt, sodass Mitarbeiter mehr Zeit für die Analyse und die strategische Entscheidungsfindung haben. lesen

Mit Apache Zeppelin Daten analysieren

Interaktives Notizbuch für Big Data

Mit Apache Zeppelin Daten analysieren

Das Apache-Toplevel-Projekt Zeppelin bietet ein Notizbuch für Daten aus anderen Systemen, mit denen Anwender diese effektiv analysieren können. Zeppelin arbeitet dazu eng mit Spark, Flink und Hadoop zusammen. lesen

Cloudera und Hortonworks vereinigen ihre Datenplattformen

Nachbericht DataWorks Summit Barcelona

Cloudera und Hortonworks vereinigen ihre Datenplattformen

Auf der diesjährigen DataWorks-Konferenz in Barcelona traten Cloudera und Hortonworks erstmals gemeinsam auf. Im Januar 2019 hatten beide auf Data Science und Big Data spezialisierten Anbieter ihren Zusammenschluss vollzogen. Als ein Ergebnis wird demnächst die neue Enterprise Data Cloud eingeführt, die vollständig auf Open Source basiert. lesen

Datenaufbereitung ist ein unterschätzter Prozess

Data Preparation

Datenaufbereitung ist ein unterschätzter Prozess

Der Prozess der Datenaufbereitung umfasst die Reinigung, Formung und Mischung von Daten, damit sie für analytische und andere Aufgaben in optimaler Qualität bereitstehen. Nur mit erstklassigen Daten lassen sich beispielsweise Lösungen für Machine Learning und Künstliche Intelligenz effizient, sicher und zuverlässig versorgen. lesen

Cloudera will nächstes Jahr profitabel sein

Nach dem Zusammenschluss mit Hortonworks

Cloudera will nächstes Jahr profitabel sein

Mit Cloudera und Hortonworks haben sich die beiden größten Anbieter im Hadoop-Umfeld zusammengeschlossen. Beide schreiben bislang rote Zahlen. Wolfgang Huber, Senior Regional Sales Director Benelux, Central and Eastern Europe, erläutert im Gespräch mit BigData-Insider, wie aus zwei defizitären Unternehmen ein auch finanziell erfolgreicher Konzern werden soll. lesen

Der Data Lake integriert sich

Data Lakes

Der Data Lake integriert sich

Data Lake oder Data Warehouse? So schien lange Zeit die Alternative für Unternehmen zu lauten. Doch wie so oft gibt es in der betrieblichen IT kein Entweder-oder, sondern beide Infrastrukturen tauchen zunehmend gemeinsam auf. lesen

Mit Apache Metron Big-Data-Projekte schützen

Open-Source-Security-Lösung Apache Metron

Mit Apache Metron Big-Data-Projekte schützen

Big-Data-Projekte sind nicht nur für Firmen interessant, sondern auch für Cyberkriminelle. Apache Metron ist ein Open-Source-Projekt für ein Security-Analytics-Framework. Die Lösung besteht aus Modulen zum Parsen, Normalisie­ren und Anreichern von Daten mit internen und externen Bedrohungsinformationen und soll Big-Data-Projekte vor unbefugtem Zugriff schützen. lesen

Cloudera und Hortonworks schließen Fusion ab

Zusammenschluss vollzogen

Cloudera und Hortonworks schließen Fusion ab

Die beiden Datenspezialisten Cloudera und Hortonworks haben ihre Fusion erfolgreich vollzogen. Gemeinsam wollen die Unternehmen eine Enterprise Data Cloud vom Edge bis hin zu Künstlicher Intelligenz (KI) entwickeln. lesen

Das sind die Trends 2019

Kommentar von Arun C. Murthy, Hortonworks

Das sind die Trends 2019

Was bringt das Jahr 2019 im Bereich Big Data und Künstliche Intelligenz? Eine Einschätzung dazu gibt Arun C. Murthy, Co-Founder und Chief Product Officer bei Hortonworks. lesen

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 44775753 / Definitionen)