Kommentar von Alexander Zschaler, Fivetran KI-Readiness ist Daten-Readiness

Von Alexander Zschaler 5 min Lesedauer

Anbieter zum Thema

Die Skalierung von KI- oder Generative-KI-Anwendungsfällen zum Schaffen von Unternehmenswert ist oberste Priorität des Unternehmens – das sagt die große Mehrheit (82 %) der befragten Führungskräfte weltweit im aktuellen Report von MIT Technology Review Insights „AI readiness for C-suite leaders“. Der Report zeigt auch, mit welchen Herausforderungen sie dabei kämpfen und welche Investitionen Priorität haben.

Der Autor: Alexander Zschaler ist Regional Vice President DACH, Zentral- und Osteuropa bei Fivetran(Bild:  Fivetran)
Der Autor: Alexander Zschaler ist Regional Vice President DACH, Zentral- und Osteuropa bei Fivetran
(Bild: Fivetran)

Generative Künstliche Intelligenz (GenAI) kann zwar beeindruckende Möglichkeiten eröffnen – doch sie bringt nicht automatisch einen geschäftlichen Mehrwert. Hierfür müssen Unternehmen ihre einzigartigen und proprietären Daten nutzen können.

An diesen Daten fehlt es Unternehmen nicht: 83 Prozent der Befragten sagen, dass ihr Unternehmen zahlreiche Datenquellen identifiziert hat. Die größte Herausforderung liegt im zweiten Teil der Antwort: „ … Datenquellen, die verknüpft werden müssen, um die KI-Initiativen zu unterstützen.“

Warum das eine Herausforderung ist, zeigt eine aktuelle IDC-Umfrage. Demnach nutzen Unternehmen „über ein Dutzend verschiedene Technologien, nur um alle Informationen über ihre Daten zu sammeln, außerdem nochmal so viele, um die Daten zu integrieren, zu transformieren und zu replizieren“, erklärt Stewart Bond, Vizepräsident von IDCs Data Intelligence and Integration Software Service. Hinzu kommt: Es gibt immer mehr und neue Datenquellen, Dateiformate und Nutzungsarten, ohne dass die alten verschwinden.

So verwundert es nicht, dass im MIT Report 82 Prozent der befragten Führungskräfte zustimmen, dass sie „die Beschaffung von Lösungen zur Datenintegration und Datenbewegung priorisieren, die unabhängig von Änderungen an der Datenstrategie und bei Partnern auch in Zukunft funktionieren werden.“

Doch die Daten, die Unternehmen für KI-Projekte brauchen, stammen nicht nur aus unterschiedlichen Quellen. Sie weisen auch unterschiedliche Grade von Sauberkeit und Vollständigkeit auf, sind strukturiert, semi-strukturiert oder unstrukturiert. Sie sind mit vielen Daten-Arten, -Typen, -Formaten und -Modi ausgesprochen vielfältig, zudem äußerst dynamisch.

Größte Herausforderungen bei der Vorbereitung von KI-Projekten

Auf die Frage, was die größten Herausforderungen bei der Vorbereitung von KI- oder Generative-KI-Projekten waren, sagen dementsprechend

  • 45 Prozent Datenintegration oder Daten-Pipelines
  • 44 Prozent Data Governance und Security
  • 43 Prozent Datenqualität

 Herausforderungen bei der Datenvorbereitung von KI-Projekten(Bild:  MIT Technology Insights Survey, 2024)
Herausforderungen bei der Datenvorbereitung von KI-Projekten
(Bild: MIT Technology Insights Survey, 2024)

Top-Investitionsbereiche

Die Teilnehmer des Reports erkennen also, dass es keinen Sinn ergibt, KI-Tools zu entwickeln, bevor die Grundlagen für die Datenintegration vorhanden sind. Das zeigt auch die Priorisierung von Investitionsbereichen im Zusammenhang mit der KI-Einführung (die Befragten sollten ihre beiden wichtigsten Prioritäten wählen). Demnach liegt die oberste Priorität mit 64 Prozent Zustimmung auf Datenintegrations- / Datenpipeline-Tools. 35 Prozent der Teilnehmer sehen Data Lakes als vorrangig an und 31 Prozent Datentransformationstools. Mit sieben Prozent sind Large Language Models (LLM) weit abgeschlagen.

Auch George Fraser, CEO von Fivetran, das den Report gesponsort hat, betont, wie wichtig es ist, zuerst in die Datenbasis zu investieren und erst dann KI zu implementieren: „Bevor man viele Data Scientists einstellt und Generative-KI-Projekte startet, sollten Unternehmen sicherstellen, dass sie ein Data Warehouse mit sauberen, kuratierten Daten haben, das alle klassischen BI- und Analyse-Workloads unterstützt. Denn sonst werden die Data Scientists ihre Zeit mit Basis-Datenintegration und -bereinigung verschwenden.“

Schwierigkeiten bei der Datenintegration

Die Integration der Daten ist jedoch alles andere als simpel. Die teilnehmenden Führungskräfte nennen zahlreiche Schwierigkeiten, allen voran das Management der Datenmenge (45 %). Doch auch das Verschieben von Daten aus On-Premises-Systemen in die Cloud (43 %), ein Echtzeit-Datenzugriff (41 %) und die Verwaltung von Datenänderungen (40 %) stellen häufig eine Herausforderung dar. Zudem erweist sich die Nutzung von externen Informationen oft als schwierig: 37 Prozent sehen bereits das Zusammenführen von Daten aus verschiedenen Standorten oder geografischen Regionen als problematisch an, 56 Prozent die Integration von Daten Dritter.

Die Lösung für eine gute Datenbasis

Wie kann also eine gute Lösung aussehen, um eine dauerhaft solide Datenbasis für KI zu bilden? Laut Fivetran-CEO George Fraser geht es im Wesentlichen darum, dass „alle Daten an einem Ort vorliegen, und zwar exakt, aktuell und in einem Schema, das die Leute im Unternehmen verstehen.“ Das ermöglicht auch eine angemessene Kontrolle.

Ein einheitlicher, nicht zweckgebundener Ansatz für Datenplattformen und -tools kann zudem die Gesamtqualität der Daten verbessern. Wird die Arbeit an der Dateninfrastruktur und -integration geteilt, so Fraser, „wird das Unternehmen als Ganzes besser im Umgang mit seinen internen Daten. Es schafft also nicht nur eine Grundlage für das aktuelle Projekt, sondern auch für alle zukünftigen Projekte.“

Wie relevant sind Security and Data Governance wirklich?

Fast ebenso häufig wie die Datenintegration bzw. Pipelines wurde Security und Data Governance als Herausforderung genannt. Schaut man tiefer in die Umfragedaten, wird deutlich, dass dies vor allem für stark regulierte Sektoren, wie staatliche Stellen und den Finanzdienstleistungssektor sowie branchenübergreifend für CDOs gilt: 95 Prozent der Befragten aus einer staatlichen Stelle bezeichnen Governance und Security als Haupthürde bei der Aufbereitung von Daten für KI. Im Finanzdienstleistungssektor liegt der Wert bei 70 Prozent, bei allen anderen nur 36 Prozent.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Betrachtet man die Funktionen, hat für 74 Prozent der CDOs Security und Governance eine Top-Priorität – und damit für rund doppelt so viele wie bei anderen Befragten der C-Suite: (CEOs: 36 %, CTOs: 38 %, CIOs: 47 %).

Stewart Bond, Vice President, Data Intelligence and Integration Software Service bei IDC, sagt, dass „die meisten Unternehmen vorgefertigte Modelle für generative KI verwenden, um ihre eigenen Daten hinzufügen und weitere Informationen in Prompts zu senden. Organisationen haben möglicherweise keine Kontrolle darüber, wenn jemand Daten in einer Geschäftsapplikation verwendet und sie an ein generatives KI-Modell sendet. Das ist ein kritisches Problem.“ Dies gilt nicht nur für stark regulierte, sondern für alle großen Unternehmen mit Kundendaten. Um das in den Griff zu bekommen, braucht es mehr als nur technologische Lösungen. „Je mehr Richtlinien und Kontrolle rund um Daten in einem operativen Speicher es gibt, desto besser“, so Bond.

Bei der Frage nach den wichtigsten Merkmalen einer entsprechenden Datenlösung nennen 100 Prozent der Befragten aus dem Regierungs- und 63 Prozent aus dem Finanzdienstleistungssektor eine integrierte Security und Governance – die mit großem Abstand häufigste Antwort. Sie verstehen also, dass Daten-Workflows und -Tools, die Governance und Security an erster Stelle berücksichtigen, anstatt sie nachträglich zu behandeln, Voraussetzung sind für den verantwortungsvollsten und konformen Einsatz dieser Technologien. Zudem führen sie am wahrscheinlichsten zu erfolgreichen KI-Implementierungen im großen Maßstab.

Fazit

Ein verschärfter Wettbewerb um den Einsatz generativer KI hat die Aufmerksamkeit erneut auf Unternehmensdaten gelenkt. Führungskräfte wissen, dass eine dauerhafte Datenbasis für aktuelle und künftige Technologien geschaffen werden muss. Hierfür hat der Report drei zentrale Grundsätze zutage gebracht:

  • 1. Zuerst muss das Datenfundament stehen, dann kann die KI-Einführung starten.
  • 2. Datenintegration ist entscheidend, um die Daten-Readiness für KI-Anwendungen zu erreichen.
  • 3. Data Governance und Security sollten von Anfang an berücksichtigt werden.

Methodik des MIT Technology Review Insights Report „AI readiness for C-suite leaders“

Der Report basiert auf einer weltweiten Umfrage unter 300 Führungskräften und leitenden Daten- und Technologieverantwortlichen. Sie wurde von MIT Technology Review Insights im Februar und März 2024 durchgeführt.
88 % der Teilnehmer stammen aus dem C-Level (22 % CEOs, 23 % CIOs, 21 % CTOs, 10 % CDOs). Mehr als die Hälfte der Befragten (53 %) arbeitet in Unternehmen mit einem Umsatz von einer Milliarde US-Dollar oder mehr. Die Organisationen der Befragten haben ihren Hauptsitz in Nordamerika (30 %), EMEA (27 %), Asia-Pacific (27 %) sowie Mittel- und Südamerika (17 %).
Sie stammen aus elf Branchen: Finanzdienstleistungen, Fertigung, IT und Telekommunikation, Konsumgüter und Einzelhandel, Pharmazie und Gesundheitswesen, Regierung, Reise und Gastgewerbe, professionelle Dienstleistungen, Energie und Versorgungsunternehmen, Transport und Logistik sowie Medien und Marketing.

Artikelfiles und Artikellinks

(ID:50062417)