Big Blue und Big Data IBM will Leader im Spark-Umfeld werden
Anbieter zum Thema
IBM entfaltet eine Reihe von Initiativen im Hinblick auf die Unterstützung von Big Data Analytics. So wird etwa Apache Spark auf der PaaS-Plattform BlueMix bereitgestellt. Von IBM und Partnern kommen weitere Produkte auf den Markt. Analysten sprechen bereits von einem „Blue Stack“ analog zu Oracles Technologiestapel „Red Stack“.

IBM unterstützt Apache Spark als In-memory-Datenverarbeitungsplattform und bietet Spark-as-a-Service auf der PaaS BlueMix in der Cloud an. Das Open-Source-Produkt Spark ist eine Parallel Computing Engine auf Hadoop, anstelle von MapReduce, und nutzt den In-memory-RAM der Rechnerknoten.
:quality(80)/images.vogel.de/vogelonline/bdb/823500/823500/original.jpg)
Daten in Hadoop schneller analysieren
Big Data in neuen Dimensionen mit Apache Spark
„Das ist das Analytics-Operations-System der Zukunft“, sagt Oliver Adamczak, Presales IBM-Leader für Big Data in der DACH-Region: „Deshalb hat IBM ein Spark Center gegründet und macht Beiträge zur Community.“ Er bekräftigt: „IBM will definitiv ein Leader im Spark-Umfeld werden.“
Fünfzehn der wichtigsten Analyse- und Commerce-Lösungen von IBM arbeiten nach Angaben des Herstellers mit Apache-Spark-Technologie. Lösungen wie IBM BigInsights, IBM Stream und IBM SPSS sollen damit sehr viel performanter werden, denn Experten bewerten die Leistung von Spark als hundert Mal höher als die von MapReduce. Rob Thomas, Vice President für Product Development bei IBM Analytics, berichtet, dass seit Juni 2015, als die Beta startete, über 5.000 Entwickler dieses Angebot genutzt hätten, um Anwendungen zu erstellen.
Insight Cloud Services
Mit den Insight Cloud Services will Big Blue Kunden wie Twitter oder The Weather Company eine höhere Performance für Analyse-Zwecke bieten. Der Service, der sich an Nutzer mit relativ geringen Fachkenntnissen richtet, soll sich problemlos in Geschäftsprozesse, Unternehmensanwendungen sowie mobile Apps integrieren lassen. Er steht Entwicklern über IBM Insights APIs for Developers, IBM Insights Data Packages for Weather und IBM Industry Analytics Solutions zur Verfügung. Die Variante Commerce Insights richtet sich an Händler.
Automatisierte Dokumentenverarbeitung
Damit verwandt sind die IBM Datacap Services, eine kognitive Lösung für die automatisierte Dokumentenverarbeitung, etwa bei Banken und Versicherungen. „Durch die Kombination von neuen Visualisierungsmöglichkeiten, natürlicher Spracherkennung und -verarbeitung sowie maschinellem Lernen ist IBM Datacap Insight Services in der Lage, die verschiedensten Arten von Dokumenten automatisch zu klassifizieren, zu verstehen und weiterzuleiten“, verlautbarte der Hersteller. Die Variante Datacap Mobile wendet sich an mobile Anwender.
Anfang Februar hat IBM weitere Insight-Services vorgestellt. Mit Apache TinkerPop steht ein neuer Graph-Datenbank-Service auf BlueMix bereit, weitere Funktionen für Predictive Analytics unterstützen sie. Damit lassen sich Analyse-Anwendungen wie Netzwerküberwachung, Betrugserkennung, Echtzeit-Erkenntnisse und Anwendungen im Internet der Dinge realisieren.
Zudem gibt es für Datenbank-Entwickler mit „Compose Enterprise“ eine Cloud-Plattform, mit der sie verteilte Web-Anwendungen erstellen können, die quelloffene Datenbank auf dedizierten Cloud-Servern nutzen.
Big Data auf Power
Aus mehreren Richtungen kommend baut IBM auf seiner Power-CPU-Plattform jene Angebotspalette auf, die die Analysten von Saugatuck Technology in Anlehnung an Oracles „Red Stack“ den „Blue Stack“ getauft haben. Dabei beziehen sie sich auf die Neuheiten, die der Hersteller Ende Oktober auf seiner Konferenz IBM Insight vorstellte. Viele dieser Neuheiten basieren auf der OpenPower Foundation, die Produkte von mehr als 160 Anbietern zusammenbringt, die IBMs Power-Plattform nutzen.
Die Power-Architektur ist für Hochleistungsanalysen ausgelegt, wie sie in der Verarbeitung von Massendaten und fortschrittlichen Analyseverfahren gelten. Letztere sieht Big Blue vor allem im Cognitive Computing, also der Anwendungen für Wissensverarbeitung, aber auch in der Genomik. Kein Wunder also, dass die Vorteile der neuen Produkte vor allem der Beschleunigung dienen. Wolfgang Maier von IBM Deutschland führt eine Anwendung im Health-Sektor an: Bei den DNS-Analysen der Firma BlueBee aus den Niederlanden sorgen Power-Systeme dafür, dass DNS-Analysen, die mitunter eine Million Euro kosten können, um den Faktor zehn oder 100, je nach System-Performance, günstiger ausfallen können.
Xilinx und IBM haben eine mehrjährige strategische Zusammenarbeit zur Entwicklung gemeinsamer Datacenter- und NFV-Lösungen (Network Function Virtualization) bekannt gegeben, die Systeme, Software und Managementkomponenten rund um Xilinxs FPGA-Beschleuniger zusammenbringen. Die Lösung ist gedacht für neue Workloads in den Bereichen Supercomputing, kognitive Anwendungen, maschinelles Lernen, Genomik und Big Data Analytics.
Nvidia-Tesla-GPUs in Kombination mit Power
Ein weiterer Hardware-Beschleuniger ist bekanntlich Nvidia mit seinen Grafikprozessoren. IBM will Nvidias Tesla-K80-GPUs mit der Power-basierten Architektur kombinieren. Die Power-CPU ist die Basis für den Analytik-Dienst Watson. Mit den Tesla GPUs sollen seine die Such- und Rangfolge-API-Fähigkeiten um 70 Prozent gegenüber der bisherigen Geschwindigkeit gesteigert werden. Diese Beschleunigung soll die Kostenstruktur von Watson-basierten Cloudservices weiter verbessern, das heißt, die Watson Cloud Services werden im Endeffekt für den Endbenutzer preisgünstiger.
Der Netzwerkspezialist Mellanox hat den ersten „smarten“ Network-Switch, den Switch-IB 2, angekündigt, der Kunden eine geschätzt bis zu zehnfache Leistung gegenüber der vorherigen Lösung ermöglichen soll. Auch der Supercomputing-Matador NEC steigt in den OpenPower-Ring. Die Japaner haben die Verfügbarkeit der ExpEther-Technologie angekündigt. Zudem wollen sie die Coherent-Accelerator-Processor-Interface-Technologie (CAPI) von IBM einsetzen, um ihren Kunden weitere Geschwindigkeitsvorteile zu bieten. CAPI ist eine interne Schnittstelle zur I/O-Beschleunigung eines Power8-Systems.
SuperVessel
Mit dem Ökosystem „SuperVessel“ haben IBM und weitere OpenPower-Mitglieder seit Juni 2015 ein weltweites Netz an Zentren und Cloud-basierten Services zum Zugang auf Power- und Akzelerator-basierte Infrastrukturen geschaffen. Wie bei der OpenPower Foundation geht es darum, dass Entwickler und Software Architects möglichst kostengünstig innovative Lösungen schaffen, die hochperformante Aufgaben ausführen können – möglichst auf Power und der IBM Cloud.
In diesem Ökosystem spielen die genannten Anbieter Nvidia und Xilinx eine wichtige Rolle, wenn es darum geht, hohe Rechenleistung als Service im Abo anzubieten. „Damit haben User Zugang zu NVIDIA-Tesla-GPUs, um die Deep Learning Frameworks Caffe, Torch und Theano sofort aus der SuperVessel-Cloud zu nützen“, formuliert es IBM.
(ID:43904905)