Data Management für KI-Workloads Fivetran launcht Managed Data Lake für Google Cloud

Von Berk Kutsal 2 min Lesedauer

Anbieter zum Thema

Fivetran erweitert seinen Managed Data Lake um eine native Anbindung an Google Cloud Storage. Unternehmen sollen damit strukturierte und unstrukturierte Daten schneller für KI- und Analyseprojekte nutzbar machen können.

Fivetran integriert seinen Managed Data Lake Service nativ in Google Cloud Storage. Unternehmen sollen so KI- und Analyseprojekte schneller realisieren.(Bild:  Fivetran)
Fivetran integriert seinen Managed Data Lake Service nativ in Google Cloud Storage. Unternehmen sollen so KI- und Analyseprojekte schneller realisieren.
(Bild: Fivetran)

Fivetran, Anbieter für automatisierte Datenintegration, hat seinen Managed Data Lake Service um eine Anbindung an Google Cloud Storage erweitert. Die Lösung soll Unternehmen dabei unterstützen, große Mengen strukturierter und unstrukturierter Daten aus über 700 Konnektoren zentral zu speichern, in offene Tabellenformate wie Apache Iceberg oder Delta Lake zu konvertieren und sie abfragebereit für KI- und Analyseworkloads bereitzustellen.

Laut Fivetran werde damit die Datenaufnahme in die Google Cloud beschleunigt und gleichzeitig die Computing-Kosten gesenkt. Zudem ermögliche die native Integration mit dem BigQuery Metastore eine verbesserte Katalogisierung der Daten, was Governance und Compliance erleichtern soll.

„KI erfordert riesige Mengen hochwertiger Daten. Aber die Bereitstellung dieser Daten im richtigen Format in großem Umfang ist eine enorme Herausforderung“, so George Fraser, CEO bei Fivetran. „Unser Managed Data Lake Service für Google Cloud Storage automatisiert den gesamten Prozess – das Verschieben, Organisieren und Optimieren von Daten in offenen Tabellenformaten. So können sich Unternehmen voll auf ihre Analysen und Innovationen fokussieren – ohne sich um die Infrastruktur kümmern zu müssen.“

Fokus auf offene Formate und schnelle Skalierbarkeit

Die Erweiterung folgt einem klaren Trend in der Cloud-Strategie: Offene Tabellenformate gelten zunehmend als Schlüssel zur Interoperabilität zwischen verschiedenen Plattformen und Analysewerkzeugen. Mit der automatisierten Konvertierung in Formate wie Apache Iceberg und Delta Lake will Fivetran insbesondere die schnelle Nutzung von Cloud-nativen KI-Services ermöglichen – ohne den administrativen Overhead traditioneller Data-Engineering-Projekte.

Google Cloud selbst betont die Relevanz offener Formate für KI-Workloads: „Unternehmen arbeiten mit größeren und komplexeren Datensätzen als je zuvor. Daher benötigen sie eine durchgängige Lösung, um diese Daten zu zentralisieren sowie für KI und Analysen vorzubereiten“, betont Yasmeen Ahmad, Managing Director of Data Analytics bei Google Cloud. „Der Managed Data Lake Service für Google Cloud Storage von Fivetran unterstützt Unternehmen bei der effizienten Übertragung ihrer Daten in offene Tabellenformate. So können sie die KI- und Analysefunktionen von Google Cloud in vollem Umfang ohne operativen Aufwand nutzen.“

Zwischen Infrastruktur und Innovation

Mit dem Ausbau seines Data-Lake-Angebots auf Google Cloud Storage adressiert Fivetran ein Problem vieler Unternehmen: den Mangel an qualitativ hochwertigen Trainingsdaten für KI-Anwendungen. Besonders für die Entwicklung kontextbezogener generativer KI und großer Sprachmodelle (LLMs) wird die Fähigkeit, heterogene Datenquellen schnell und skalierbar zusammenzuführen, zum Wettbewerbsfaktor.

Fivetran verweist auf erste Erfolge bei Partnern wie Quantiphi, wo die Plattform zur Zentralisierung komplexer Datensätze für KI-Lösungen genutzt werde. Konkrete Benchmarks oder Metriken zu Effizienzgewinnen und Kostensenkungen nannte das Unternehmen bislang nicht.

Keine Revolution, aber ein logischer Schritt

Trotz der neuen Funktionalitäten handelt es sich bei dem Managed Data Lake für Google Cloud Storage eher um eine evolutionäre Weiterentwicklung als um eine technologische Disruption. Bereits 2024 hatte Fivetran einen ähnlichen Service vorgestellt. Mit der jetzt erfolgten Integration soll vor allem die bestehende Kundschaft – darunter Konzerne wie Siemens, Lufthansa und VW Financial Services – einen reibungsloseren Übergang von der Experimentier- zur Produktionsphase in KI-Projekten erhalten.

(ID:50389274)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung