Datenintegration in der Hybrid Cloud-Ära

ETL-Prozesse einfach gestalten Datenintegration in der Hybrid Cloud-Ära

05.04.2019 Von Florian Karlstetter

Anbieter zum Thema

Talend Germany GmbH

Board Deutschland GmbH

QUNIS GmbH

Fivetran Germany GmbH

Das Thema Datenintegration gehört mit zu den größten Herausforderungen beim Management von hybriden und Multi-Cloud-Umgebungen. Schließlich geht es darum, Daten aus verschiedensten Quellen möglichst verlässlich aufzubereiten und zusammenzuführen. Nur wenn der vorhandene Datenpool, neuenglisch auch als „Data Lake“ bekannt, aktuell und vollständig ist, lassen sich daraus verlässliche Analysen ableiten.

Stitch Data Loader von Talend: Self-Service-Datenintegration für Cloud Data Warehouses.(Bild: Talend) — Stitch Data Loader von Talend: Self-Service-Datenintegration für Cloud Data Warehouses.
(Bild: Talend)

In Zeiten in denen Cloud Computing in immer mehr Bereiche der IT-Infrastruktur integriert wird, wird es naheliegenderweise auch immer komplizierter, die einzelnen Services miteinander, teils untereinander zu verbinden, aus immer mehr Datenquellen den jeweils gewünschten Pool zu erstellen und bei all den unterschiedlichen Schnittstellen den Überblick nicht zu verlieren. Früher gab es dafür eigene IT-Abteilungen, in denen Data Scientists die Fachabteilungen mit den jeweils nötigen Informationen versorgten.

Heute ist es aber meist nicht mehr nur eine zentrale Datenbank, über die man - nach Definition und Eingabe der entsprechenden Filter - das gewünschte Resultat erzielen kann. Vielmehr geht es darum, all die Daten, die verstreut von unterschiedlichsten Cloud-Applikationen erzeugt werden, wieder zusammenzuführen, um sie für Auswertungen oder Analysen nutzbar zu machen.

Je mehr Cloud Services eingesetzt werden, desto höher ist der Aufwand der individuellen Anbindung. Da liegt es nahe, den Fachabteilungen die Entscheidung zu überlassen, welche Daten gerade gefragt sind, um sie dann möglichst einfach per Self Service in ein Cloud Data Warehouse oder - neuenglisch - in einen Data Lake zu überführen.

Mit der Übernahme von Stitch hat sich Talend im November 2018 einen solchen Lösungsansatz gesichert und mittlerweile ins eigene Portfolio integriert. Stitch ist eine Cloud-first, entwicklerorientierte Plattform, mit der sich schnittstellenbasiert Daten aus beliebigen Cloud-Quellen in eigene Datenbanken zur weiteren Bearbeitung übertragen lassen. All das, dank vorgefertigter Templates intuitiv und selbst für unerfahrene Anwender schnell einsetzbar.

Über Talend

Talend bietet ein breites Portfolio an Lösungen für Cloud- und Datenintegration.(Bild: Talend) — Talend bietet ein breites Portfolio an Lösungen für Cloud- und Datenintegration.
(Bild: Talend)

Talend, führender Anbieter von Lösungen für die Cloud-Integration, hilft Kunden dabei, mit den richtigen Daten die Geschäftsentwicklung schneller voranzutreiben. Talend Cloud ist die zentrale Plattform für die übergreifende Datenintegration aus public, private und hybriden Clouds sowie aus lokalen IT-Infrastrukturen und stärkt die Zusammenarbeit zwischen IT und den Fachbereichen. Mit Self-Service-Lösungen sowie Hunderten von vorgefertigten Adaptern für die Anbindung von SaaS-Applikationen bis zum Cloud-Data-Warehouse können Organisationen mit Talend ihre Anforderungen kosteneffizient erfüllen, die durch die rapide Zunahme von Daten, Nutzern und Anwendungsszenarien entstehen.

Rund 3.000 globale Kunden vertrauen auf Talend und lassen ihre Daten für sich arbeiten, wie zum Beispiel GE, HP Inc. und Domino’s. Talend ist unter führenden Marktanalysten und in Publikationen wie Forbes, InfoWorld und SD Times als Branchenführer anerkannt. Auch ist Talend im Gartner´s 2019 Magic Quadrant für Data Quality Tools erneut als Leader ausgezeichnet worden.

Weitere Informationen finden sich auf der Website von Talend.

Die notwendigen Mechanismen

Mit dem Stitch Data Loader lassen sich Daten aus über 90 Quellen innerhalb weniger Minuten in eine Data Warehouse-Umgebung übertragen. Unterstützt werden alle großen Plattformen wie Microsoft Azure SQL Data Warehouse, Amazon Redshift und Amazon S3, Google Big Query oder auch Snowflake und PostgreSQL oder data.world DW. Dabei führt der Stitch Data Loader Datentyptransformationen zwischen Quelle und Ziel, Schemaänderungen, Sicherheitsfunktionen und das Laden auch größter Datenmengen transparent durch. Eine integrierte Planungsfunktion unterstützt dabei, die Cloud-Daten kontinuierlich auf dem aktuellen Stand zu halten.

Talend positioniert Stitch auch für unerfahrene Anwender, zumindest was die vorgefertigten Konnektoren und deren Grundfunktionalität angeht.(Bild: Talend) — Talend positioniert Stitch auch für unerfahrene Anwender, zumindest was die vorgefertigten Konnektoren und deren Grundfunktionalität angeht.
(Bild: Talend)

Die Erfassung von Daten und erforderliche Skalierungen erledigt Stitch mit nur wenigen Klicks. Alle Vorgänge durchlaufen einen reibungslosen Prozess. Einige Konnektoren von Stitch bietet Talend auch kostenlos an, zusätzlich gibt es eine kostenlose Trial-Version, 5 Millionen Zeilen pro Monat sind dabei stets kostenlos erhältlich. Das dürfte für eine Evaluation meist völlig ausreichen.

Der Stitch Data Loader verbindet sich mit verschiedensten SaaS-Anwendungen, Datenbanken und Cloud-Datenquellen wie MySQL, Salesforce, Stripe, aber auch Google AdWords, Facebook Ads, Hubspot bis hin zu Zapier. Die komplette Übersicht der unterstützten Datenquellen gibt es auf der Website von Stitchdata.com.

Bildergalerie

Talend adressiert naturgemäß das Thema Datenintegration, aber auch die Integration neuer Technologien wie Machine Learning Analytics.(Bild: Talend)

Speed & Trust, also Performance und Governance spielen in der Strategie von Talend eine ebenfalls gewichtige Rolle.(Bild: Talend)

Data Integration, Datenintegrität und Data Intelligence, gebündelt in einer „Digital Transformation Platform“.(Bild: Talend)

Collect, govern, transform & share - Datenintegration par excellence: vielschichtige Quellen, verschiedene Zielgruppen, alle möglichen Anwendungsszenarios über eine zentrale Plattfom steuerbar.(Bild: Talend)

Bildergalerie mit 11 Bildern

Mögliche Einsatzszenarien

Neben den klassischen Anwendungsgebieten wie der Datenintegration für Analyse und Reporting lassen sich mit Stitch im Zusammenspiel mit weiteren Talend-Lösungen auch neue Technologien wie Machine Learning evaluieren und für das eigene Unternehmen nutzen. Auch hier reduziert Talend dank Self Service-Komponenten die Komplexität: Developer und Data Scientists müssen sich nicht mit der Entwicklung von geeigneten Modellen vertraut machen, sondern können auf benutzerfreundliche ML-Standardkomponenten zurückgreifen.

Talend bietet hier vorgefertigte „Out-of-the-Box“-Komponenten, die schnell und einfach integriert werden können. Dies erlaubt es Datennutzern, unabhängig von ihrem Kenntnisstand, mit Algorithmen zu arbeiten – ohne dass sie wissen müssen, wie ein Algorithmus funktioniert oder wie er konstruiert ist. Gleichzeitig können Experten diese Algorithmen je nach Bedarf anpassen, da Basis-Komponenten aus dem Talend-Portfolio auch als Open Source zur Verfügung stehen.

Fazit

„Extract, Transform, Load“ (ETL) hat im Multi-Cloud-Zeitalter einen ganz besonderen Stellenwert. Der „Komplexität den Schrecken nehmen“ gehört ein Stück weit mit zur Unternehmensphilosophie von Talend. So lassen sich Datenintegration und Datenmanagement in Hybrid und Multi-Cloud-Szenarien mit Talend komfortabel orchestrieren und um neue Technologien wie Machine Learning anreichern. Zusätzlich adressieren die Lösungen und Plattformen von Talend weitere wichtige Faktoren wie Verlässlichkeit der Daten (Trust), Governance (Rückverfolgbarkeit) und Geschwindigkeit.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Geschäftliche E-Mail

Bitte geben Sie eine gültige E-Mailadresse ein.

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Stand: 08.12.2025

Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.

Einwilligung in die Verwendung von Daten zu Werbezwecken

Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.

Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.

Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.

Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.

Recht auf Widerruf

Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.

(ID:45839935)