Die Erfahrungen, die Unternehmen im vergangenen Jahr gemacht haben, zeigen: Generative Künstliche Intelligenz – GenAI – ist nicht einfach nur ein weiteres technisches Tool. Sie verändert grundlegend, wie wir künftig an Aufgaben herangehen – insbesondere an solche, die komplexe analytische Herausforderungen mit sich bringen. Besonders in der Datenwissenschaft, dem Ursprung vieler GenAI-Ansätze, sind die Auswirkungen eindeutig sichtbar.
Die Autorin: Rosaria Silipo ist VP of Data Science Evanglism bei KNIME
(Bild: KNIME)
GenAI hat sowohl ein ungeheures Potenzial als auch klare Grenzen. Um die richtige Balance zwischen Chancen und Einschränkungen zu finden, müssen Datenwissenschaftler daher gezielt abwägen, wie und wo GenAI sinnvoll eingesetzt werden kann.
GenAI als Dialogpartner für Data-Science-Workflow
Die unmittelbarsten Auswirkungen von GenAI werden sich in den alltäglichen Abläufen der Datenwissenschaft zeigen. Dabei behalten wir die Kontrolle über den gesamten Designprozess, verlassen uns jedoch zunehmend auf Künstliche Intelligenz (KI) bei der praktischen Umsetzung.
Ein gutes Beispiel dafür ist das Codieren, das traditionell ein zeitintensiver Prozess ist. Heute kann dieser Schritt nun direkt im Dialog mit der KI durchgeführt werden. KNIME beispielsweise entwickelt speziell hierfür Tools, die Data-Science-Teams dabei helfen, sich in der Welt der generativen KI zurechtzufinden. Die Plattform führt innovative Knoten ein, die die KI-Integration aus zwei wesentlichen Perspektiven angehen:
Zum einen unterstützt GenAI beim Erstellen von Anwendungen sowohl durch klassische Codierung als auch durch Low-Code-Ansätze.
Zum anderen können Nutzer Aufgaben direkt umsetzen, indem sie Eingabeaufforderungen an GenAI-Modelle senden und deren Antworten erhalten.
Mit den richtigen Tools können wir also Data-Science-Workflows effizienter gestalten. In einer meiner letzten Projekte konnte ich sehen, wie ein Teammitglied eine komplexe Minard-Diagramm-Visualisierung vollständig durch KI-Interaktion erstellte, ohne eine Zeile Code zu schreiben. Ein faszinierendes Beispiel, wie KI den Arbeitsalltag verändern kann.
Stärken von GenAI nutzen, aber kritisch bewerten
Die Textverarbeitung erweist sich als offensichtliche Stärke von GenAI, das gilt sowohl bei der Themenerkennung als auch bei der Generierung mehrsprachiger Inhalte. Das lässt sich beispielsweise für Anwendungsbereiche wie die Betrugserkennung nutzen. Nimmt man beispielsweise einen Workflow auf Basis von Isolation Forest, einem Algorithmus, der Datenanomalien mithilfe von Binärbäumen erkennt. So lassen sich Betrugsfälle identifizieren und das Opfer kann gewarnt werden. Dazu müssen Haftungsausschlüsse in verschiedenen Sprachen hinzugefügt und bei geänderten Vorschriften angepasst werden. Dabei konnte GenAI hervorragende Arbeit leisten.
Doch es gibt auch klare Grenzen. Bei numerischen Vorhersagen und der Erkennung von Ausreißern zeigt GenAI Schwächen. Eine kleine Änderung in der Eingabeaufforderung kann zu großen Abweichungen in den Ergebnissen führen – und das oft ohne eine klare Erklärung, warum diese Abweichungen auftreten. An dieser Stelle wird die KI für mich als Datenwissenschaftlerin weniger zuverlässig, da die Nachvollziehbarkeit fehlt.
Beispiel Kundensegmentierung
Ein weiteres praktisches Anwendungsbeispiel für den Einsatz von GenAI ist die Kundensegmentierung. Früher setzten wir eine Anwendung ein, bei der die Stimmungsanalyse zusammen mit demografischen und betrieblichen Daten genutzt wurde, um den Kundensegmentierungsprozess zu unterstützen. In dieser Anwendung wurde der Teil zur Stimmungsanalyse durch eine KI-generierte Stimmung aus den Kundenbewertungstexten ersetzt. Beim Clustering-Prozess jedoch blieben wir bei der klassischen K-Means-Methode.
Warum haben wir nicht stattdessen auf KI gesetzt? Natürlich könnte man die Daten in GenAI-Modelle wie ChatGPT einspeisen und eine Clusterung des Datensatzes anfordern. Doch ChatGPT führt im Hintergrund ein Python-Skript aus, was nur bei einfachen Datensätzen und einfachen Datenflüssen funktioniert. Sobald der Datenfluss komplexer wird, etwa durch die Integration zusätzlicher Verfahren zur Merkmalsgenerierung, wird es schwierig, diese Anforderungen in eine KI-Eingabeaufforderung einzuspeisen. Auf einer Plattform wie KNIME hingegen zieht man einfach einen Knoten per Drag & Drop und hat in weniger als 30 Sekunden die gewünschte Clusterung.
Im Gegensatz dazu kann die Anwendung zur Sentiment-Analyse weitaus komplexer zu implementieren sein und erfordert spezifische Daten. Daher ist es hier günstiger, schneller und einfacher, die KI zu bitten, eine Sentiment-Analyse durchzuführen.
Allerdings zeigen auch diese Beispiele – wie bereits bei der Betrugserkennung – die Risiken und Einschränkungen, die bei der Nutzung von GenAI auftreten können, besonders bei komplexeren Auswertungen. Es wird deutlich, wie wichtig es ist, dass menschliche Expertise und eine kritische Bewertung weiterhin ein integraler Bestandteil der KI-Nutzung bleiben. Data-Analytics-Plattformen, die mit Visual Workflows arbeiten, begegnen diesen Herausforderungen, indem sie spezielle Knoten für cloudbasierte Sprachmodelle erstellen, einschließlich Funktionen wie Authentifizierung, Verbindung und Eingabeaufforderung. Für komplexere Implementierungen stellt beispielsweise KNIME zusätzlich Knoten zur Unterstützung des Retrieval-Augmented-Generation-Prozesses (RAG) zur Verfügung, wodurch die KI-Integration zwar komplexer, aber auch kontrollierbarer wird.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Datenwissenschaftler als Dirigenten
Trotz all dieser Fortschritte werden Datenwissenschaftler auch in Zukunft nicht überflüssig werden. Ihr Aufgabenfeld wird sich dafür verändern. Sie werden zunehmend zu Dirigenten einer Symbiose aus künstlicher und menschlicher Intelligenz. Dazu müssen Datenwissenschaftler KI-Modelle sorgfältig auswählen, deren schnelle Weiterentwicklung im Auge behalten, eine strategische Aufsicht gewährleisten und KI-Ergebnisse kritisch validieren.
Ich sehe auch eine vielversprechende Entwicklung bei kleinen Sprachmodellen (SLMs), die die Zukunft der Datenwissenschaft prägen könnten. Diese bieten für bestimmte Anwendungsfälle eine höhere Genauigkeit als die riesigen Modelle, die momentan häufig verwendet werden. Es wird zunehmend klar, dass nicht alle Aufgaben von den riesigen Sprachmodellen optimal abgedeckt werden können, und spezialisierte Modelle können hier tatsächlich einen größeren Mehrwert bieten. Für mich gilt daher: Was KI besser kann, kombiniere ich mit klassischen Data-Science-Techniken. Was traditionelle Techniken besser können, nutze ich.
KNIME untersucht diese Entwicklungen aktiv und fügt kontinuierlich Knoten hinzu, die sich mit Datenschutz, Modellkonformität und Anonymisierung sensibler Daten befassen. So ermöglichen etwa die Workflow-Tools von KNIME diese nahtlose Integration und ermöglichen es Datenwissenschaftlern, KI-generierte Erkenntnisse mit traditionellen Analysemethoden zu kombinieren.
Ausblick: Die Zukunft der Datenwissenschaft mit KI
Die Transparenz stellt eine erhebliche Hürde für die Einführung von GenAI dar, denn große Sprachmodelle sind neuronale Netzwerke und damit Black Boxes, die keine vollständige Transparenz über ihre Entscheidungsprozesse bieten können.
Bei der Evaluierung von Einsatzbereichen für GenAI sollten Unternehmen neben der Transparenz und der Kosteneffizienz auch kritisch prüfen, wie korrekt die von der KI gelieferten Informationen sind und wie Kontrollen zur Qualitätssicherung umgesetzt werden können.
Trotz dieser Herausforderungen gehe ich davon aus, dass in den nächsten fünf Jahren viele Data-Science-Teams über ihre eigenen KI-Assistenten verfügen werden. Der Mensch wird jedoch die strategische Aufsicht und Leitung übernehmen, um sicherzustellen, dass die KI-Modelle effektiv und verantwortungsvoll eingesetzt werden.
Die Zukunft der Datenwissenschaft wird also nicht von einem Wettstreit zwischen Mensch und KI geprägt sein. Vielmehr geht es darum, wie Mensch und KI bestmöglich zusammenarbeiten können. Um diese technologische Symbiose zu ermöglichen, sind Tools und Plattformen gefragt, die die Kluft zwischen menschlicher und künstlicher Intelligenz überbrücken können.