Die Verarbeitung von Daten aus den unterschiedlichsten Quellen, Teil 1 Wer die Daten hat, der braucht Analysewerkzeuge

Autor / Redakteur: Holm Landrock / Rainer Graefen |

Schon im vergangenen Jahr hat Experton Group den ersten Big Data Vendor Benchmark für Deutschland vorgestellt. In diesem Jahr wurden die Daten präzisiert. Noch tummeln sich viele Anbieter in dem aufstrebendem Marktsegment.

Anbieter zum Thema

Die Anbieter von Big-Data-Analytics-Softwarelösungen
Die Anbieter von Big-Data-Analytics-Softwarelösungen
(Grafik: Experton Group)

Experton hat in seinen Marktuntersuchungen in der Kategorie „Analytics“ einen genaueren Blick auf die Anbieter geworfen, die für die Big-Data-Aufgaben von Kunden Dienstleistungen rund um den Rechenzentrumsbetrieb und den Betrieb von IT-Systemen anbieten.

Die Offerings im Bereich der Analytics-Software zeichnen sich unter anderem dadurch aus, dass sie um eine bereits existierende Software weitere Analyse-Tools entwickeln. Um diese Offerings werden dann vielfach Beratungsangebote entwickelt, die mit der Komplexität der Anwenderprobleme auch selbst an Komplexität zunehmen. Das kann auf Anwender mitunter verwirrend wirken.

Die wichtigsten Big Data Analyse-Softwarefirmen
Bildergalerie mit 24 Bildern

Appliances machen mehr Formate analysierbar

Einzelne Anbieter liefern ihre Lösung zusätzlich als Appliances, die die eigentliche Analytics-Anwendung in ein vorkonfiguriertes System mit Server, Storage, Netzwerk, Datenbank und Middleware integriert.

Die betrachteten Big-Data-Analytics-Lösungen zeichnen sich dadurch aus, dass sie im Unterschied zu den bisherigen klassischen Business-Analytics/Business-Intelligence-Lösungen nicht nur größere Datenmengen, sondern mehr unterschiedliche Formate verarbeiten können und Berechnungsergebnisse schneller liefern.

Historisch bedingt und auf Basis der ersten großen Erfolge liegt der Schwerpunkt häufig in einem bestimmten Marktsegment wie zum Beispiel dem Handel. Oft liegt der Fokus noch stark auf dem Datenvolumen, aber möglicherweise werden von der Anwendung auch schon stark diversifizierte Daten aus unterschiedlichen Quellen und in unterschiedlichen Formaten verarbeitet.

Bewertungskriterien für Big Data Analytics

Ein maßgebliches Kriterium für die Beurteilung des Offerings ist die Fähigkeit der Verarbeitung von Daten aus den unterschiedlichsten Quellen. Das können viele Lösungen in der Theorie belegen. Die meisten praktischen Anwendungsbeispiele kommen jedoch noch aus Einsatzgebieten, deren Daten in der Regel sehr gut strukturiert sind – beispielsweise Maschinendaten oder Textdaten mit begrenzten Textlängen und Strukturelementen wie URL-Kurzformen bzw. durch Sonderzeichen markierte Bestandteile.

Die Verteilung der Unternehmen im Wettbewerbsfeld zeigt, dass eine ganze Reihe von Unternehmen technologisch sehr gut aufgestellt ist. Diese Unternehmen haben jetzt die Chance, mit neuen komplexen Anwendungsszenarien und einer Stärkung ihrer (Service-) Organisation weit nach vorn zu drängen, wobei sie auch große internationale Unternehmen verdrängen können.

Oracle nutzt R

Oracle Advanced Analytics, Oracle OLAP und Oracle RT Decision Server sind Lösungen, die zur Spitze der aktuell im Markt verfügbaren Offerings gehören. Bemerkenswert und durch positive Rückmeldungen von Anwendern bestätigt, ist Oracles eigene Distribution von R für die Oracle-Datenbanken 11g und 12c.

Mit R wird eines der leistungsfähigsten Analytics-Tools mit leistungsfähigen Hardware-Lösungen verknüpft. Dadurch ist Oracle sicherlich auch für die engere Auswahl interessant. Die Existenz der entsprechenden Speicherlösungen (Oracles Engineered Systems) wirkte sich unterstützend auf diese Positionierung aus, weil Oracle dadurch insgesamt eine fortschrittliche Grundlage für Big-Data-Analysen liefern kann.

Gleich drei Analytics-Engines kann IBM in die Waagschale werfen: Da ist das Hadoop-basierende BigInsights, die InfoSphere Streams für die Verarbeitung von Streaming Data und die PureData-Systeme für Analysen oder DB2-Lösungen.

Information Management und Data Governance, wie von manchen Anbietern im Markt fast schon als eigenständige Big-Data-Lösung angepriesen, werden von IBM als unterstützende Lösungskomponenten zugrunde gelegt.

(ID:42620118)