Suchen

Strata + Hadoop World 2015 Talend 6 setzt auf Apache Spark

| Autor / Redakteur: Dipl. -Ing. Thomas Drilling / Nico Litzel

Talend hat auf der Fachmesse Strata+Hadoop World Version 6 seiner Datenintegrations-Plattform vorgestellt, die nach eigener Einschätzung erste integrierte Lösung dieser Art auf Basis von Apache Spark.

Firmen zum Thema

Talend 6 nutzt über 100 Spark-Komponenten. Das erlaubt Talend zufolge eine einzigartige Datenverarbeitungsgeschwindigkeit und soll es nahezu jedem Unternehmen erlauben, Echtzeit-Analytik zu betreiben und Streaming-Big-Data- oder IoT-Sensorinformationen unmittelbar in sofort aktionsfähige Einblicke zu konvertieren.
Talend 6 nutzt über 100 Spark-Komponenten. Das erlaubt Talend zufolge eine einzigartige Datenverarbeitungsgeschwindigkeit und soll es nahezu jedem Unternehmen erlauben, Echtzeit-Analytik zu betreiben und Streaming-Big-Data- oder IoT-Sensorinformationen unmittelbar in sofort aktionsfähige Einblicke zu konvertieren.
(Bild: Talend)

Talend 6, beziehungsweise Talend Real Time Big Data, ist die laut Talend branchenweit erste Datenintegrationsplattform mit nativer Unterstützung von Apache Spark und Spark Streaming. Allerdings erheben diesen Anspruch auch eine Reihe von Mitbewerbern mit ihren auf der Strata + Hadoop World 2015 vorgestellten Neuerungen.

Nach Ansicht von Mike Tuchen, CEO von Talend, erfordert schnelle Analytik unbedingt eine schnelle Datenintegration: „Wir haben stark auf Spark gesetzt, weil wir wissen, dass es in einem immer heißer umkämpften Markt hinsichtlich geschäftskritischer Informationen oft auf jeden Moment ankommt.“

Laut John Tripier, Leiter für Geschäftsentwicklung bei Databricks, dem Unternehmen, das Apache Spark mit kommerziellem Spark-Support populär gemacht hat, finden zurzeit aufregende Spark-Entwicklungen statt, weil immer mehr Hersteller, wie Talend, MapR & Co. die In-Memory Engine mehr und mehr im Mainstream etablierten: „Seit Jahren wandeln große Internetunternehmen Echtzeit-Datenmanagement und Analytik in einen wichtigen Wettbewerbsvorteil um. Mit Apache Spark und intuitiven Integrationsplattformen wie Talend 6 werden die Bedingungen für alle fairer und ausgeglichener.“

Talend Data Integration

Talends Plattform erlaubt eine leistungsfähige Datenintegration auf Basis einer offenen und skalierbaren Architektur. Die Besonderheit: Mit einfachen grafischen Tools und Wizards generieren Entwickler von Analyse-Anwendungen in kurzer Zeit nativen Code und können zudem die Entwicklung mit Continuous-Delivery-Funktionen beschleunigen.

Als Teil von „Talend Data Fabric“ stellt „Talend Data Integration“ außerdem einheitliche Tools für die Integration, Bereinigung, Maskierung und das Profiling von Daten mit dem Ziel bereit, dass Unternehmen fundiertere Entscheidungen auf der Grundlage ihrer Daten treffen können. Talend Data Fabric bietet zudem verbesserte Komponenten für eine Vor-Ort- und eine Cloud-Datenintegration, Datenqualität, Master Data Management und mehr.

Über 100 Spark-Komponenten

Mit der Nutzung von mehr als 100 Spark-Komponenten soll Talend 6 eine einzigartige Datenverarbeitungsgeschwindigkeiten ermöglichen und es so nahezu jedem Unternehmen erlauben, Echtzeit-Analytik zu betreiben und Streaming-Big-Data- oder IoT-Sensorinformationen unmittelbar in sofort aktionsfähige Einblicke zu konvertieren. Die Echtzeit-Big-Data-Integration mit Spark ermöglicht viele neue, dynamische Anwendungsfälle für praktisch jedes vertikale Marktsegment, vom Einzelhandel über das Gesundheitswesen bis hin zur Landwirtschaft.

Mit der nativen Spark-Integration sollen Talend-Nutzer MapReduce-Jobs faktisch per Klick in Spark umwandeln können und damit eine sofortige Leistungssteigerung um das Fünffache erzielen. Im Vergleich zu einem manuellen Vorgehen beim Erstellen von Spark-basierten Programmcodes lässt sich die Entwicklerproduktivität mit Talend nach Ansicht des Herstellers sogar um das Zehnfache steigern.

Im Wesentlichen verantwortlich für eine Produktivitätssteigerung dieser Größenordnung seien nach Aussage von Talend neben der intuitiven Designschnittstelle die vordefinierten Spark-Komponenten mit automatisierter Spark-Code-Generierung, die das manuelle Schreiben von Programmcode überflüssig machen. Um die Unterstützung für nahezu jede Art von Projekt weiter zu vereinfachen, bietet Talend eine neue, integrierte Lambda-Architektur mit einer Umgebung zum Arbeiten mit Bulk- und Batch-, Streaming- und IoT-Daten.

Weitere Neuerungen

Neben der Spark-Unterstützung bringt die Version 6 der Talend-Plattform viele weitere neuen Funktionen und Verbesserungen mit, darunter:

  • „Kontinuierliche Lieferung“ beispielsweise meint einen Entwicklungsansatz, der es erlaubt, dass Geschäftsbereiche wie Integrationsentwicklung, Test, Bereitstellung und Betrieb als ein „Lieferteam“ reibungslos zusammenwirken können. Der automatisierte Erstellungs-, Test- und Release-Prozess senkt das Risiko, während gleichzeitig Agilität und Innovation erhöht werden.
  • Die Features „Master Data Management“ (MDM), REST-API- und Query-Support vereinfachen das Einbetten einer „360-Grad-Ansicht“ des Kunden in Echtzeit in Web- und Mobilanwendungen, also Kundeneinblicke, die sowohl aus herkömmlichen, als auch aus neuen Big-Data-Quellen wie Blogs, Social Media, Mobil- und SaaS-Anwendungen stammen.
  • Die neue Datenmaskierung und Semantikanalyse ermöglicht Unternehmen ein besseres Management von Compliance- und Datenschutzbeschränkungen, indem der Prozess des Verbergens und Sicherns personenbezogener Daten bei der Freigabe im gesamten Unternehmen erleichtert wird. Kundendaten lassen sich so besser vor Missbrauch oder Verletzungen schützten während der Semantik-Analysator es Fachbenutzern ermöglicht, ihre Daten dank automatischer Feststellung des Datentyps und HDFS-Dateiprofilerstellung besser zu verstehen.

Eine vollständige Liste sämtlicher neuer Funktionen von Talend 6 steht auf Talends Produktseite zur Verfügung. Die Spark-Unterstützung ist sowohl Bestandteil von Talend Big Data als auch von Talend Real-Time Big Data.

Verfügbarkeit

Version 6 sämtlicher Talend-Open-Source-Produkte kann ab sofort heruntergeladen werden. Ferner ist die Version 6.0.1 aller kommerziellen, mit einem Support-Abonnement verknüpften-Produkte ab sofort verfügbar und wird Bestandskunden im Rahmen ihrer Subskriptionsvereinbarung bereitgestellt. Zudem stehen sämtliche Produkte in Form virtueller Images zum Testen zur Verfügung.

(ID:43632468)

Über den Autor

Dipl. -Ing. Thomas Drilling

Dipl. -Ing. Thomas Drilling

IT-Consultant, Trainer, Freier Journalist