MapR 6.1 soll Big Data unternehmenstauglicher machen

Mehr Security, schnellere Analyse und günstige TCO

| Autor / Redakteur: Karin Johanna Quack / Nico Litzel

Die Architektur der MapR Data Platform
Die Architektur der MapR Data Platform (Bild: MapR Technologies)

Ein neues „Major Release“ seiner Datenplattform MapR hat der gleichnamige Softwareanbieter aus Santa Clara, Kalifornien, für den kommenden Herbst in Aussicht gestellt: MapR 6.1 ist unter anderem dafür ausgelegt, die Datenanalyse für KI-Anwendungen zu beschleunigen und die Betriebskosten zu senken.

Fabian Wilckens, Head of Central Europe MapR Technologies
Fabian Wilckens, Head of Central Europe MapR Technologies (Bild: MapR Technologies)

„Wir wollen Big Data in die Unternehmensrealität überführen“, so formuliert Fabian Wilckens, Head of Central Europe für die MapR Technologies Inc., das aktuelle Geschäftsziel des Softwareunternehmens. In der Big-Data-Welt gebräuchliche Open-Source-Werkzeuge wie Hadoop oder auch Spark seien zwar konsequent für die Verwaltung und Verarbeitung großer Mengen unterschiedlicher Daten konzipiert worden, ohne dabei jedoch besondere Rücksicht auf Unternehmensbedürfnisse wie Struktur und Sicherheit zu nehmen.

Ted Dunning, Chief Application Architect bei MapR, geht sogar noch einen Schritt weiter, indem er einräumt: Die Security-Option sei beim Hadoop-Projekt anfangs – wie in den Pionierzeiten des Big-Data-Zeitalters üblich – mehr oder weniger „off“ gestellt worden.

Ted Dunning, Chief Application Architect bei MapR Technologies
Ted Dunning, Chief Application Architect bei MapR Technologies (Bild: MapR Technologies)

Eigentlich hätte sich das Open-Source-Projekt damit für den Einsatz in den unternehmenskritischen „Systems of Record“ selbst disqualifizieren müssen. Doch mangels Alternativen wollten viele Organisationen bei ihren ersten Schritten in die Welt der fortgeschrittenen Datenanalyse nicht darauf verzichten.

Hochperformante Streaming-Analyse

Mittlerweile gibt es Softwareunternehmen, die – aus der Data-Warehouse-Welt kommend – Open-Source-Projekte in die Enterprise-Welt zu integrieren versuchen. Andere zielen darauf ab, die quelloffenen Lösungen zu „professionalisieren“ und so mit den kommerziellen Systemen zu verbinden.

Hier etwa sieht MapR sein Spielfeld. Gerade mit dem neuen Release 6.1 sollen nicht nur technische Features und Handhabbarkeit, sondern auch Sicherheit und Wirtschaftlichkeit der Software besser werden.

Auf der Liste der neuen Features weit oben stehen die vereinfachte Entwicklung und Auslieferung von Analytics- und KI-Anwendungen. In dieses Umfeld gehören beispielsweise die Unterstützung von Spark 2.3 für eine hochperformante Verarbeitung von Streaming-Daten sowie der Support für Streaming SQL, KStreams und Hive 2.3.

Weitgehende Integration mit Kubernetes

In Richtung Mainstream weist MapR mit einem anderen Teil seiner jüngsten Produktankündigung: Das Unternehmen verspricht eine weitergehende Integration mit dem „Kubernetes“-Projekt. Das Open-Source-Vorhaben wird maßgeblich von Google und Microsoft vorangetrieben und laut Dunning von sehr vielen MapR-Kunden bereits eingesetzt.

„Kubernetes ist für die Anwendungen, was MapR für das Daten-Management ist“, erläutert Wilckens. Mit seinem „abstrahierenden“ Zugriff unterstütze MapR das Management der Daten unabhängig von der Infrastruktur. Kubernetes leiste quasi Dasselbe für die Anwendungen, trenne also die Applikation vom Betriebssystem und mache sie damit über Infrastrukturgrenzen hinweg portabel. MapR habe nun die Voraussetzungen geschaffen, dass die beiden Projekte miteinander interagieren und zusammen ein umfassendes Management-Framework bilden.

Von seinem Ursprung her ist MapR selbst ein Open-Source-Vorhaben. Die Plattform setzt sich aus den Komponenten „FS“ (File System), „DB“ (Datenbank) und „Streams“ zusammen, die, wie die Bezeichnungen suggerieren, unterschiedliche Datentypen unterstützten. Und zwar für den Nutzer transparent, also über Deployment-Grenzen hinweg: on premise, in der Cloud oder in hybriden Systemen, on the edge oder eben in einer Kubernetes-Umgebung.

Native S3-Schnittstelle

In jüngster Vergangenheit hat sich die Datenschnittstelle S3 als starke Alternative zu traditionellen Datenzugriffsmethoden herauskristallisiert – vor allem im Umfeld der Amazon Web Services (AWS). MapR. 6.1 bietet deshalb eine native S3-Schnittelle, mit der sich operationale Daten direkt analysieren und Anwendungen transparent zwischen On-Premise- und Cloud-Umgebungen portieren lassen.

Wie Wilckens ergänzt, arbeitet MapR aber nicht nur über Infrastruktur- und Deployment-Grenzen hinweg, sondern auch unabhängig von den verwendeten Werkzeugen. Und das ohne proprietäre Schnittstellen. „Es gibt immer mehr Tools, man kann nicht für alle Interfaces bauen“, stellt der Zentraleuropachef klar, „deshalb hat MapR eine Architektur, die offene Schnittstellen unterstützt.“

Für prominente Werkzeuge, zum Beispiel Hadoop und Spark, übernehme MapR beziehungsweise einer seiner Partner auch den Support, verspricht Wilckens. „Für andere wie zum Beispiel Eigenentwicklungen russischer Studenten können wir das natürlich nicht“, bremst er überzogene Erwartungen.

Mehr Sicherheit für Systems of Record

Das Thema Sicherheit will MapR durch das „Security-by-default“-Prinzip bei der Entwicklung abdecken. Das ist quasi ein Paradigmenwechsel (in Richtung „Security on“), wenn man Dunning glauben darf.

Neu in Release 6.1 ist das Prinzip der Volume-based Data-Encryption. Es soll den unautorisierten Zugriff auf sensible Daten verhindern. Durch Verschlüsselung lässt sich laut MapR künftig auch kriminellen Aktionen wie Packet Sniffing oder Diebstahl von Speicher-Devices vorbeugen.

Konkret soll das neue Release beispielsweise „Core- und Ecosystem-Services“ für neue Installationen enthalten: Auf Knopfdruck werden alle Daten beim Speichern und alle Netzverbindungen bei der Authentisierung verschlüsselt.

Object Tiering: schneller oder billiger?

Um die Kosteneffizienz zu erhöhen, erlaubt MapR künftig ein „Policy-Driven Automatic Data Placement“. Vereinfacht ausgedrückt geht es darum, die Objekte stets in der Art von Speichermedium zu halten, die der Nutzungshäufigkeit beziehungsweise Kritikalität und damit der benötigten Zugriffsgeschwindigkeit angemessen ist. Dazu werden die Daten oder Streams in unterschiedliche Aggregatzustände eingeteilt („brandheiß“ bis „eiskalt“) – im Fachjargon heißt das „Object Tiering“.

Im Einklang mit den jeweiligen Verfahrensregeln der Organisation misst und bewertet MapR nun die Datennutzung und verschiebt die Daten graduell in eine langsamere (und billigere) oder schnellere (und teurere) Speicherform. Eine Abkürzung in Richtung eines möglichst wirtschaftlichen Abspeicherns von Daten erlaubt das „Fast Ingest Erasure Coding“.

Deutsche Kunden mit Autonomous Driving

An dem neuen Release haben einige MapR-Kunden aktiv mitentwickelt, verrät der Anbieter. Darunter sei auch ein deutscher Automobilhersteller, den das Thema autonomes Fahren umtreibe. Zu den heimischen Anwenderunternehmen, die schon öffentlich auf MapR-Veranstaltungen referiert hätten, gehörten die Deutsche Post und BASF sowie der Thermomix-Zweig von Vorwerk.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 45369050 / Infrastruktur)