Suchen

MapR-Distribution Version 5 kommt im Juli MapR 5.0 erweitert Hadoop für Echtzeit-Anwendungen

| Autor / Redakteur: Dipl. -Ing. Thomas Drilling / Nico Litzel

Die Hadoop-Distribution von MapR bietet in der im Juli erscheinenden Version 5.0 Echtzeit-Funktionen und neue Sicherheitsfeatures. Neu hinzugekommen ist darüber hinaus eine Datenauswertung als Self Service.

Firmen zum Thema

MapR 5.0 kommt im Juli.
MapR 5.0 kommt im Juli.
(Bild: MapR)

MapR hat auf dem Hadoop Summit im kalifornischen San Jose Version 5 seiner Hadoop-Distribution vorgestellt, die unter anderem mit neuen Funktionen für das automatische Synchronisieren von Speichern, Datenbanken und Suchindexen aufwartet und damit Suchen innerhalb und über Rechenzentren hinweg erlaubt.

MapR 5.0 ermöglicht mit seiner Architektur das schnelle Verarbeiten von Big Data Jobs auf einem einzigen Hadoop-Cluster und bietet eine völlig neue Generation von Echtzeit-Anwendungen. Die kommende Version bringt darüber hinaus ein umfassendes Sicherheits-Auditing und eine Unterstützung für Apache Drill mit und integriert die Features von Hadoop 2.7 sowie YARN 2.7. Laut Aussage von MapR betreiben immer mehr Unternehmen mehrere Big-Data-Anwendungen auf einem einzigen Hadoop-Cluster (mehr als 20 Prozent der MapR-Kunden), einige sogar bis zu 50 verschiedene Applikationen.

MapR und das OSS-Hadoop-Ökosystem
MapR und das OSS-Hadoop-Ökosystem
(MapR)

Die Neuerungen von MapR 5.0 im Überblick

  • Hadoop 2.7/YARN 2.7: Die neuen aus Hadoop 2.7, bzw. YARN resultierenden Funktionen unterstützen sowohl den integrierten Docker-Container als auch die auf Plattformebene bekannten, regelmäßigen Updates jetzt auch für YARN-Applikationen.
  • Datenübertragung in Echtzeit: Die MapR-Datenbank kann mithilfe von Tabellenreplikation Daten in Echtzeit synchronisieren und für externe Rechenmaschinen verfügbar machen. Den Anfang macht die auf Lucene beruhende Suchplattform Elasticsearch. Das erlaubt beispielsweise synchronisierte Volltext-Suchindexe ohne Hinzufügen von benutzerspezifischem Code.
  • Erweiterungen für Data Governance und Sicherheit: MapR 5 erlaubt ein umfassendes Auditing für den Datenzugriff via Log-Files im JSON-Format, für das Reporting und schnelle Analysen mithilfe von Apache Drill. Diese ergänzen die bereits verfügbaren Funktionen zur Authentifizierung und Autorisierung von MapR.
  • Unterstützung von Drill 1.x, einschließlich Drill Views: Der Support von Apache Drill 1.0 erlaubt einen sicheren Zugang zu Daten auf Feldebene innerhalb von Dateien. Dies stellt sicher, dass ausschließlich autorisierte Daten analysiert werden. Ferner können Analysten können jetzt Berechtigungen erhalten, um Datensets mit anderen zu teilen.

Die neue Version 5 von MapR soll ab Juli 2015 verfügbar sein. Neben der Community-Edition bietet MapR je eine kostenpflichtige Enterprise- und Enterprise-Database-Edition an.

Stimmen

Nach Ansicht von IDC-Analyst Carl W. Olofson wird Hadoop, da primär als System zur Analyse von Batchdateien konzipiert, nur selten mit operativer Analyse und Transaktionsverarbeitung in Verbindung gebracht. Der Einsatz von Hadoop begünstige jedoch die Entscheidungsfindung auf der strategischen und der ausführenden Ebene und entwickelt sich laut Olofson immer weiter zu einem Framework, das auch unmittelbare, taktische Entscheidungen unterstützt. Angesichts der stetigen Innovationen für Hadoop 2.7, die auch in MapR 5.0 eingeflossen sind, könnten Unternehmen Hadoop als „Entscheidungsplattform nutzen, die gleichzeitig Live-Daten verarbeitet und Echtzeit-Analysen bietet.“

(ID:43450111)

Über den Autor

Dipl. -Ing. Thomas Drilling

Dipl. -Ing. Thomas Drilling

IT-Consultant, Trainer, Freier Journalist