Nachbericht Everyday-AI-Konferenz, London Dataiku erweitert Plattform um Responsible AI und AI Governance

Von Michael Matzer

Anbieter zum Thema

Dataiku, Anbieter der Data-Science-Plattform DSS, hat auf seiner „Everyday AI“-Konferenz in London den rund 700 Besuchern die Version 11 von DSS vorgestellt. Besonderes Augenmerk hat der Hersteller auf Responsible AI und AI Governance gelegt.

Das Logo der Everyday AI Conference 2022
Das Logo der Everyday AI Conference 2022
(Bild: Dataiku )

Die Version 11 von DSS soll den Datentechnikern und -wissenschaftlern durch neue Tools die Arbeit erleichtern. Zu diesen Arbeiten gehören die Erstellung von individuellem Programmcode, die Ausführung von Modellexperimenten und die Erfassung von Datenmengen höchster Qualität.

Ein visueller Pfad für Bewältigung von Aufgaben im Feld der Computeroptik führt erfahrene wie auch neue Data Scientists durch die Schritte der Objekterfassung und Bildklassifizierung, von der Datenvorbereitung über das Programmieren bis zur Bereitstellung von Deep-Learning-Modellen.

Bildergalerie
Bildergalerie mit 5 Bildern

Ein kollaboratives, verwaltetes Framework für die Etikettierung von Bildern erlöst Teams von der Aufgabe, externe Werkzeuge oder Dienste für das Labelling anzufordern und stellt sicher, dass die Themenexperten, Etikettierer und Modellierer eng zusammenarbeiten. Gut etikettierte Trainingsdaten, besonders Bilder, sind Gold wert, bereiten aber auch viel Mühe.

Kollaboration

Die visuell gestaltete Vorhersage von Zeitreihen soll Mitarbeiter in den Fachabteilungen in die Lage versetzen, belastbare Forecast-Modelle ohne Programmierung zu erstellen. Ein zentraler Speicherort für Leistungsmerkmale und neue kollaborative Workflows sollen Teams erleichtern, Artefakte und Workflows à la Jupyter-Notebooks zuverlässig wiederzuverwenden und damit Projekte zu beschleunigen.

Leistungsfähige Was-wäre-wenn-Beschleuniger sollen Teams helfen, den besten Pfad zu bewerten, wie sich Geschäftsergebnisse optimieren lassen. Ein Beispiel: Welche Änderungen könnte ein Fertiger an den Fabrikbedingungen vornehmen, um das maximale Produktionsergebnis zu erzielen? Eine Bank könnte herausfinden, welche Anpassungen im Finanzprofil eines Kunden nötig sind, damit die geringstmögliche Wahrscheinlichkeit für einen Kreditausfall besteht.

Vertrauen durch erweiterte Kontrolle

Um verantwortungsvolle AI-Praktiken und AI Governance zu fördern, sollen neue Fähigkeiten in DSS 11 Organisationen helfen, sowohl Vertrauen als auch Risiken in ihrem Unternehmen zu verwalten. Im Mittelpunkt dieses erweiterten Angebots steht eine zentrale Registry, um die Sichtbarkeit aller Arten von Daten- und Analyseprojekten zu gewährleisten, um sie abzuzeichnen, bevor sie in Betrieb genommen werden. Die automatische Dokumentation eines Workflows sowie vorbeugende Belastungstests von Modellen sollen KI-Modelle zusätzlich stärken und Führungspersonal in Projekte mit Zuversicht erfüllen, zugleich aber auch Datenverbraucher und Stakeholder mit Vertrauen erfüllen.

Die Umfrage

Dataiku hat auf seiner „Everyday AI“-Konferenz unter den Besuchern eine Umfrage hinsichtlich der Nutzung von Data Science und KI-Technologien durchgeführt. Manche Ergebnisse sind im Vergleich zu 2019 ermutigend, andere niederschmetternd. Mit nur 140 Befragten ist die Umfrage nicht signifikant, sondern eher eine Stichprobe oder ein Stimmungsbild.

In mehreren Branchen, v. a. unter Finanzdienstleistern und IT-Fachleuten, antworteten Nutzer zwischen der Studenten- und der Vorstandsebene, auf der Geschäfts- wie auf der Technikseite. Schnell haben sich erhebliche Unterschiede zwischen Geschäfts- und IT-Seite herausgestellt. So haben Manager keinerlei Problem mit dem Reinigen, Verteilen und Erkunden von Datenbeständen, weil das die Data Engineers erledigen. Deren Prozentsatz in diesem Zusammenhang sank gegenüber dem Prä-CoVid-Jahr 2019 von 43 auf 27 Prozent, was Dataiku als positiv beurteilt. Die Manager hat vielmehr mit Change Management in ihrer Organisation zu kämpfen, das erforderlich sei, um die Daten nutzen (21 Prozent) und in Dashboards, Apps oder Visualisierungen (ebenfalls 21 Prozent) verwenden zu können.

MLOps ist zwar ein heißes Thema, aber die Anwender mühen sich immer noch mit den Grundlagen dafür ab. Nur zwei Prozent der Befragten bezeichneten als „schwierigsten und/oder zeitaufwendigsten Datenprozess“ MLOps, wenn sie ML-Modelle, die schon genutzt werden, überwachen und anpassen müssten. Im Gegensatz dazu bezeichneten 45 Prozent der Befragten das Reinigen, Handhaben, Erkunden oder das Verbinden von Daten und deren Aufnahme in die Datenverwaltung als zeitraubendste Tätigkeit. Ohne diese unerlässliche Vorstufe lassen sich keine tauglichen Modelle erstellen und nutzen.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

Auch das Auffinden vertrauenswürdiger Daten und der Zugriff darauf stellt sich für viele als Herausforderung dar. Nur ganze sechs Prozent der Befragten gaben an, dass es „sehr leicht“ sei, vertrauenswürdige Daten oder Analysen zu finden, wann immer sie sie bräuchten. Der Durchschnittswert zwischen 0 (sehr leicht) und 5 (sehr schwierig) liegt bei 2,7. Der Durchschnittswert von 2,4 war hingegen bei datenorientierten Managern zu finden, wohingegen Berufstätige ohne Datenfokus einen Wert von 3.0 angaben, denn offenbar hatten sie Schwierigkeiten mit dem Zugang zu vertrauenswürdigen Daten oder Analysen.

Business Intelligence

Die Fähigkeit, Erkenntnisse aus Daten zu gewinnen, ist weiterhin in Daten-Teams oder bei datenzentrischen Rollen zu finden. 69 Prozent der Befragten gaben dies an, wohingegen 40 Prozent der Befragten sagten, dass dies auf Mitarbeiter in den Fachabteilungen zuträfe. 23 Prozent, also fast jeder Vierte, der Befragten gaben an, dass die Führungsebene die Befugnis und Fähigkeit (durch Tools, Training usw.) habe, Erkenntnisse aus Daten zu gewinnen.

Zum Vergleich die Zahlen von 2019: Damals waren 48 Prozent – fast jeder Zweite – der Meinung, dass ausschließlich Daten-Teams dazu in der Lage seien, während nur 14 Prozent angaben, dass die Fachabteilungen UND die Daten-Teams für Analysen verantwortlich seien. Hinsichtlich der Demokratisierung der Business Intelligence hat sich also viel gebessert.

Die Bedeutung der Ausbildung

Unternehmen und Organisation haben seit 2019 Fortschritte hinsichtlich der formalen Ausbildung gemacht, wenn es um das Verständnis der „Rolle von Daten, des Maschinellen Lernens und der KI für das Geschäft“ geht. Waren es 2019 nur 27 Prozent der Befragten, die eine formale Ausbildung und/oder Zertifikate bestätigten, so sind es 2022 immerhin schon 37 Prozent. Hinzu kommen 37 Prozent, die angaben, sie böten „weiterführende Lektüre, selbstständige Lernkurse oder ähnliches“ an, um das obige Verständnis für KI zu fördern. 22 Prozent der Befragten gaben an, dass sie Mentoren- oder Buddy-Programme anböten.

Responsible AI

Hinsichtlich der Realisierung von Responsible AI gibt es noch viel Handlungsbedarf. Fast ein Viertel der Befragten (23 Prozent) gab an: „Ich weiß, dass wir nichts tun, um proaktiv sicherzustellen, dass wir eine Responsible AI erstellen.“ Ein weiteres Viertel (25 Prozent) sagte: „Ich weiß nicht oder bin nicht sicher, was wir tun, um das Thema Responsible AI anzugehen.“ Dataiku findet es alarmierend, dass 18 Prozent aus der Finanzbranche (die repräsentiert durch 45 Befragte rund 33 Prozent aller Befragten darstellte) angaben, „ich weiß, dass wir nichts tun, um proaktiv sicherzustellen, dass wir eine Responsible AI bauen“.

Zuversicht

Die Führungsebene ist überraschenderweise weniger zuversichtlich, was die Fähigkeit ihrer Organisation angeht, Everyday AI zu einer Realität werden zu lassen, als die Praktiker auf der technischen Seite wie etwa Data Scientists, Ingenieure usw. Auf einer Skala von Null (keine Zuversicht) bis Fünf (maximale Zuversicht) gaben die datenorientierte Führungskräfte einen Durchschnittswert von 2,9 an, wohingegen die Datentechniker im Schnitt 3,4 Punkte erreichten. Somit lag der Gesamtdurchschnitt bei etwa 3,1.

(ID:48440438)