Kommentar von Andreea Munteanu, Canonical Die fünf größten Herausforderungen für MLOps

Von Andreea Munteanu 5 min Lesedauer

Anbieter zum Thema

Kaum war ChatGPT gestartet, wurde der KI/ML-Markt plötzlich für alle attraktiv. Aber ist es so einfach, ein KI-Projekt zu starten? Und was noch wichtiger ist: Was braucht man, um Skaleneffekte mit einer KI-Initiative zu erzielen? MLOps oder Machine Learning Operations ist die Antwort, wenn Machine Learning Workflows automatisiert werden sollen.

Die Autorin: Andreea Munteanu ist AI/ML, MLOps Product Manager bei Canonical(Bild:  Canonical)
Die Autorin: Andreea Munteanu ist AI/ML, MLOps Product Manager bei Canonical
(Bild: Canonical)

Die Einführung von MLOps ist mit der Einführung von DevOps vergleichbar: In beiden Fällen muss man seine Denk- und Arbeitsweise ändern. Der erzielbare Return on Investment ist jedoch die Mühe wert. Wichtig sind besonders zwei Aspekte: Zum einen ist MLOps relativ neu. Es ist also völlig normal, dass der Weg dorthin Herausforderungen mit sich bringt. Andererseits entwickelt sich MLOps sehr schnell weiter, sodass jeden Tag neue Lösungen auftauchen. Was ist hier also zu beachten und wie können Unternehmen die häufigsten MLOps-Herausforderungen bewältigen?

MLOps-Herausforderung Nr. 1: Mangel an Talenten

Der Jobbörse Indeed zufolge gibt es in Deutschland aktuell knapp 6.000 offene Stellen im Bereich Data Science (Data Analysts und Data Scientists) und mehr als 8.700 Stellenangebote für Data Engineers, die ein unterschiedliches Maß an Erfahrung, Ausbildung und Fähigkeiten erfordern. Eine Karriere im Bereich Data Science ist sehr attraktiv geworden und es gibt viele Möglichkeiten auf dem Markt.

Die Attraktivität dieses Stellenprofils wird auch zukünftig sehr hoch bleiben. So erwartet der Personalvermittler Michael Page, dass bis zum Jahr 2026 circa 11,5 Millionen offene Stellen im Bereich Datenwissenschaft geschaffen werden.

Betrachtet man diese Daten aus einem anderen Blickwinkel, so investieren Unternehmen zunehmend in Mitarbeiter, die Machine-Learning-Initiativen unterstützen können. Sie räumen KI-Projekten Priorität ein und investieren nicht nur in Ausrüstung, sondern auch in Talente.

Das bringt jedoch Herausforderungen mit sich, wenn es darum geht, qualifizierte Mitarbeiter zu finden und die Fluktuation in den Teams für maschinelles Lernen und Datenwissenschaft zu verringern. Qualifikationsdefizite und Personalfluktuation beeinträchtigen die Umsetzung des ML-Lebenszyklus und den Zeitrahmen für neue Initiativen.

Diese Herausforderung zu bewältigen, ist aufgrund ihres Wettbewerbscharakters schwierig. Remote arbeitende Mitarbeiter einzustellen, wäre eine Variante. Dies erhöht die Chancen, Zugang zu qualifizierteren Mitarbeitern zu erhalten. Eine weitere Möglichkeit besteht darin, auf junge Talente zu setzen, die gezielt im Unternehmen durch Praktika oder Graduiertenprogramme gefördert werden. Diese Strategie greift indes nur langfristig. Wer kurzfristig Unterstützung benötigt, dem können Unternehmen, die Beratungsdienste anbieten, den Einstieg in die KI erleichtern. Je nachdem, wie weit sie in Sachen KI sind, können diese bei Anwendungsfällen, der MLOps-Architektur oder sogar beim Proofs of Concepts beraten.

MLOps-Herausforderung Nr. 2: Die ersten Schritte gehen

Wo und wie anfangen? Das erste KI-Projekt auf den Weg zu bringen, stellt für die meisten Unternehmen eine Herausforderung dar. Der Einstieg in die KI ist so einfach wie ein Business Case. Mit dem Beantworten dieser drei Hauptfragen kommt man dem, was man erreichen will, doch viel näher: Welches Problem soll gelöst werden? Sind die Erwartungen realistisch? Liegen die richtigen Daten vor?

Wer eine KI-Projekt auf den Weg bringen will, muss es mit dem Ziel vor Augen denken und darauf hinarbeiten. Anschließend kann man die KI-Reife des eigenen Unternehmens beurteilen und ein eigenes Programm entwickeln. Fragen zu Lücken, die es zu schließen gilt, zu Schlüsselfaktoren, zu vermeidenden Fallstricken und Herausforderungen bei der Infrastruktur, helfen Unternehmen dabei, zu prüfen wie gut sie auf den Einsatz von KI vorbereitet sind. Daraus ergibt sich die Gestaltung der gesamten KI-Initiative. Letztlich sollte diese Gestaltung helfen, Prioritäten zu setzen, ein Budget zu definieren und einen angemessenen Zeitplan festzulegen.

MLOps-Herausforderung Nr. 3: Daten

Daten sind das Herzstück eines jeden KI-Projekts. Sie können über Erfolg oder Misserfolg einer Initiative entscheiden. Validitätsprüfungen sind erforderlich, um sowohl die Datenqualität als auch die Datenzugriffspunkte zu bewerten. Obwohl sie heute überall vorhanden zu sein scheinen, hatten Daten für die meisten Unternehmen nicht immer Priorität. Aus diesem Grund sind die Datenerfassungsprozesse oft nicht sehr gut definiert, was zu unsauberen und inkonsistenten Daten führt.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Die Datenaufbereitung ist insgesamt nicht einfach. Unternehmen stehen oft vor großen Herausforderungen beim Verwalten, Erfassen und Speichern von Daten. Oft stammen sie aus unterschiedlichen Quellen, was zu Unstimmigkeiten bei Werten und Formaten führt. Andererseits sind Modelle des maschinellen Lernens auf große Datenmengen angewiesen, die oft schwer zu handhaben sind.

Die Bewältigung dieser Herausforderung ist vielschichtig, da sie sich auf verschiedenen Ebenen auswirkt. Das Erfolgsgeheimnis liegt wahrscheinlich in einem sorgsamen Umgang mit den Daten. Es erleichtert die Aufbereitung der Daten, wenn man Inkonsistenzen begrenzt und Daten zentral speichert. Durch das Versionieren lassen sich Probleme lösen, die entstehen, wenn man Änderungen in Daten vornimmt.

MLOps Herausforderung Nr. 4: Sicherheit

Für das maschinelle Lernen wird häufig auf sehr sensible Daten zugegriffen, die aus sensiblen Projekten stammen. Daher ist eine sichere Umgebung für den langfristigen Erfolg des Projekts entscheidend. In einem von IBM veröffentlichten Report über die Einführung von KI heißt es, dass eines von fünf Unternehmen Schwierigkeiten hat, die Datensicherheit zu gewährleisten. Das hat zur Folge, dass sich immer mehr Menschen mit diesem Thema beschäftigen, was auch erklärt, warum 25 Prozent der Befragten Sicherheitsexperten sind.

Unter den Sicherheitsproblemen ist die Verwendung veralteter Bibliotheken das häufigste. Die Benutzer sind sich oft nicht bewusst, dass sie über mehrere Schwachstellen verfügen, die böswilligen Angriffen Tür und Tor öffnen.

Eine weitere Sicherheitslücke betrifft Modell-Endpunkte und Datenpipelines, die nicht angemessen gesichert sind. Diese sind manchmal öffentlich zugänglich, sodass sensible Metadaten von Dritten eingesehen werden können. Endpunkte sind Entwicklungsumgebungen, und sie als solche zu behandeln bedeutet, klare Sicherheitsstandards zu haben, die nicht nur die Sicherheit des Projekts, sondern auch die Sicherheit der Daten gewährleisten.

Sicherheit kann für jede MLOps-Umgebung eine Herausforderung darstellen. Daher ist der Einsatz von Software, die Sicherheitspatches und -unterstützung bietet, für den Erfolg des Projekts und seine Einführung in die Produktion unerlässlich. Werkzeuge, die mehrmandantenfähig sind, schützen die interne Umgebung, die Vertraulichkeit der Daten und die Sicherheit der verschiedenen Initiativen, die für die Öffentlichkeit sensibel sein können.

MLOps Herausforderung Nr. 5: Skaleneffekte erzielen

Wie McKinsey in dem Bericht „The State of AI in 2022“ feststellt, sind viele Unternehmen dazu übergegangen, nicht nur KI zu experimentieren, sondern sie aktiv in Unternehmensanwendungen einzubinden. Das bestätigt einerseits das Engagement der Unternehmen für KI-Projekte, wirft andererseits aber auch viele Fragen in Bezug auf Wissen und Skalierung auf. Angefangen bei den richtigen Arbeitsabläufen und Werkzeugen für die Bereitstellung und Überwachung von Modellen bis hin zur Infrastruktur, die zur Unterstützung einer solchen Initiative erforderlich ist, müssen sich die Unternehmen schnell anpassen und neue Verfahren erlernen.

Open Source wird von vielen für maschinelles Lernen bevorzugt. Durchgängige MLOps-Plattformen wie Charmed Kubeflow gehören zu den Open-Source-Optionen auf dem Markt. Die Plattform deckt eine Reihe von Tools, mit denen Data Scientists bereits vertraut sind, mehrere Skalierungsanforderungen ab, z. B. Automatisierung, Überwachung, Alarmierung, Integration und Bereitstellung. Funktionen also, die sich ideal dazu eignen, die häufigsten MLOPs-Herausforderungen zu bewältigen.

(ID:49832711)