Künstliche Intelligenz (KI), Machine Learning (ML) und Large Language Models (LLM) sind die aktuellen Hype-Themen, die zunehmend über die Wettbewerbsfähigkeit vieler Unternehmen entscheiden werden. Doch viele scheitern bereits beim ersten Schritt: der Datenbasis. Warum das so ist und wie dieser erste Schritt gelingen kann, war Thema der Fivetran Modern Data Stack Event Series, die vor Kurzem in München Station gemacht hat. Personio und Sennder berichteten aus der Praxis.
Der Weg der digitalen Transformation – und damit zur Data Maturity – hat für Mark van De Wiel, Field CTO von Fivetran, vier Stufen.
(Bild: Fivetran)
Mark van De Wiel, Field CTO von Fivetran
(Bild: Fivetran)
Der Weg der digitalen Transformation – und damit zur Data Maturity – hat für Mark van De Wiel, Field CTO von Fivetran, vier Stufen: Auf der ersten werden Daten gar nicht genutzt und Entscheidungen ausschließlich aufgrund von persönlichem Wissen und Erfahrung getroffen.
Unternehmen, denen es gelingt, ihre Daten über Silos hinweg zu verbinden, sind auf der zweiten Stufe angelangt. Sie können bereits beschreibende Analysen und Ad-hoc-Reports erstellen. Bei jüngeren Unternehmen sind diese Analysen jedoch oft unvollständig, während etablierte mit einer Legacy- oder DIY-Infrastruktur zu kämpfen haben. Die Folgen: eine mangelhafte Datenqualität, ein hoher Aufwand und damit langsame Prozesse.
Mit einer modernen Infrastruktur in Form eines Modern Data Stack (MDS) gelangen Unternehmen auf die dritte Stufe. Der MDS setzt sich aus Tools verschiedener Anbieter zusammen, die sich ideal ergänzen. Üblicherweise gehören dazu:
Datenpipelines, die Daten aus verschiedenen Quellen (Facebook Ads, CRM-System, E-Mail, ERP-Systeme, etc.) auf eine zentrale Datenplattform bringen,
ein Data Warehouse oder Data Lake als zentrale Datenplattform,
ein Datentransformationstool zur Aufbereitung der gesammelten Rohdaten,
eine Datenvisualisierungs- oder Business-Intelligence-Plattform zur Datenanalyse.
„Sie basieren alle auf Standards wie SQL und bilden ein Ökosystem, in dem die Unternehmen eng zusammenarbeiten und die Tools sich sehr gut integrieren“, so van De Wiel. „Dank Consumption Based Pricing können Unternehmen damit einfach auf kleinem Niveau starten.“
Mit einem MDS verfügen Unternehmen über eine erheblich höhere Datenqualität und schnellere Prozesse. Sie können ihre Daten für detaillierte Auswertungen, standardisierte Reports und Predictive Analytics nutzen.
Die Herausforderung besteht jetzt darin, mit den Anforderungen bzw. der Entwicklung des Unternehmens Schritt zu halten und das Erreichte trotz ständiger Änderungen aufrecht zu erhalten. Dies gelingt, wenn Datenteams von Maintenance-Arbeiten entlastet sind und alle Mitarbeitenden Zugriff auf die jeweils relevanten Daten haben. Denn damit verfügt jede Abteilung zuverlässig über aktuelle, hochwertige Daten, mit denen sie schnell die Erkenntnisse gewinnen kann, um Entscheidungen zu treffen und Innovationen voranzutreiben.
Riesige Datenmengen effizient managen
„Viele Unternehmen verfügen über immense Datenmengen, scheitern jedoch am entscheidenden ersten Schritt“, so die Erfahrung von Mark van De Wiel. Denn die Zentralisierung von Daten ist eine komplexe Aufgabe: Der Aufbau und die Pflege von Datenpipelines erfordert erhebliche Ressourcen, trotzdem sind sie meist unzuverlässig und liefern keine ausreichende Datenqualität. Hier kommt Fivetran ins Spiel. Van De Wiel erläutert: „Als vollständig verwaltete, automatisierte Data Movement Plattform zentralisiert Fivetran Daten zuverlässig, sicher und schnell. Für die Datenmengen, wie sie für LLM nötig sind, unterstützen wir alle wichtigen Data-Lake-Destinationen, und mit einer RAG-Architektur (Retrieval Augmented Generation) kann unsere Lösung Generative-KI-Modelle um die erforderlichen Daten ergänzen.“
Die Fivetran-Datenintegrationsplattform verbindet zahlreiche Quellen (oben) mit verschiedenen möglichen Zielen (unten).
(Bild: Fivetran)
Erfolgsbeispiele aus der Praxis
Morgan Stanley ist ein Fivetran-Kunde, der KI und Machine Learning bereits für Innovationen nutzt: Die Finanzberater verwenden anstelle eines marktorientierten Ansatzes jetzt einen individuellen Ansatz, mit dem sie die besten Empfehlungen für einzelne Kunden ermitteln können – ein wichtiger Wettbewerbsvorteil. Hierfür hat Morgan Stanley seine Datensilos aufgebrochen und die internen Datennutzer innerhalb von vier Jahren von etwa 100 auf 2.000 gesteigert. Um diese Größenordnung zu erreichen, ist das Unternehmen in die Cloud migriert und setzt auf eine neue Datenarchitektur mit Fokus auf Datenzugriff und Echtzeitdaten. Damit kann Morgan Stanley komplizierte SQL-, Python- und LLM-Programme einsetzen und seine Data-Science-Strategie evaluieren.
Startpunkt von Personio und Sennder …
Personio, eine HR-Software für KMUs, sowie Sennder, eine der führenden Speditionen in Europa, berichteten auf dem Modern Data Stack Event von ihrem Weg zum datengetriebenen Unternehmen. Auch sie starteten mit der Zentralisierung ihrer Daten. Personio startete mit selbstentwickelten Tools auf Basis von AWS-Services und APIs, um Daten aus zahlreichen SaaS-Lösungen, Datenbanken und Streaming-Datenquellen in eine Datenplattform zu laden. Großer Schwachpunkt der Lösung: APIs ändern sich relativ häufig, sodass das Datenteam viel Zeit dafür aufwenden musste, alles up-to-date zu halten. Mit den Daten echten Mehrwert für das Unternehmen zu generieren, war so nicht möglich.
Ähnlich bei Sennder: Hier lud ein kundenspezifisches Airflow-Setup Daten aus zwei Quellen in eine Postgres-Datenbank, sodass Nutzer Dashboards erstellen konnten. Doch der Data Engineer war vollauf damit beschäftigt, Airflow am Laufen zu halten. Zudem war die Datenbank nicht skalierbar, sodass mit dem exponentiellen Wachstum des Unternehmens eine andere Lösung notwendig wurde.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
… auf dem Weg zum datengetriebenen Unternehmen
Sennder entschied sich für einen Modern Data Stack bestehend aus Snowflake als Daten-Plattform, Fivetran als Data Movement Platform, dbt für die Datentransformation und Looker als BI-Tool. „Diese Tools sind sehr leicht zu pflegen, sodass sich unser Datenteam jetzt auf Dinge konzentrieren kann, die echten Einfluss auf das Business haben, anstatt Tools zu debuggen und zu entwickeln“, erklärt Tobias Rummelsberger, Data Engineer bei Sennder.
Heute kann jeder Mitarbeiter bei Sennder auf die relevanten Daten zugreifen und Self-Service BI-Dashboards erstellen, um seine Entscheidungen datengestützt zu treffen. Sennder nutzt die Daten außerdem, um Machine-Learning-Modelle zu trainieren und seinen Kunden datengestützte Produkte anzubieten.
Nicht nur die Technologie zählt
Raffael Dzikowski, Staff Data Platform Engineer bei Personio
(Bild: Fivetran)
Personio stand auf seinem weiteren Digitalisierungsweg vor drei Herausforderungen: Erstens mussten viele Datenquellen unterstützt werden, gleichzeitig sollte die Plattform flexibel und wartungsfreundlich bleiben. Zweitens war Sicherheit unbedingt zu gewährleisten, es brauchte also eine skalierbare und zuverlässige Grundlage. Und drittens sollte die Datenplattform für Nutzer in allen Unternehmensfunktionen optimal nutzbar sein. „Man kann die beste Plattform der Welt mit tollen Features aufbauen. Aber wenn sie für die Nutzer zu kompliziert ist, wird es kein Erfolg“, erklärte Raffael Dzikowski, Staff Data Platform Engineer bei Personio.
Dass der menschliche Aspekt nicht zu vernachlässigen ist, zeigte das Fivetran Modern Data Stack Event immer wieder – in den Diskussionsrunden ebenso wie im Vortrag von Edwin Commandeur, Principal Field Product Manager bei Fivetran. Er wies darauf hin, dass es sowohl Ressourcen als auch Schulungen braucht, damit jeder in der Organisation die Daten versteht und weiß, wie er sie für die jeweiligen Anwendungsfälle effektiv nutzen kann. „Auch Sicherheit muss Teil der Schulungen sein. Und machen Sie diese zur Pflicht“, rät Commandeur.
Außerdem gilt es, die Prozesse so anzupassen, dass die Mitarbeiter den Modern Data Stack tatsächlich nutzen. „Der wichtigste und schwierigste Punkt ist aus meiner Sicht aber, die gemeinsame Nutzung von Daten durchzusetzen“, so Commandeur weiter. „Es ist verständlich, dass Teams oft zögern, ihre Daten zur Verfügung zu stellen. Aber wenn Silos beseitigt und Kennzahlen standardisiert werden sollen, führt kein Weg daran vorbei. Einer unserer Kunden hat das gelöst, indem er die Daten klassifiziert und Regeln für ihre Verwendung formuliert hat.“
Personio führte zahlreiche Trainings durch, um alle Mitarbeiter in dem Prozess mitzunehmen und ein Mindset zu schaffen, das Daten als wertvolle Ressource erkennt. Auf der technischen Ebene setzt Personio seit rund einem Jahr auf Fivetran, um die genannten Herausforderungen zu lösen. „So konnten wir die Quellen sehr einfach innerhalb weniger Minuten anbinden“, berichtet Raffael Dzikowski. „Die Verbindungen sind sehr robust und stabil, sodass wir sicher sein können, immer korrekte, aktuelle Daten zu nutzen. Gleichzeitig hat unser Datenteam jetzt die Zeit, um Mehrwerte für das Unternehmen zu schaffen.“