Definition Was ist MLOps?
Machine Learning Operations (MLOps) überträgt das in der Softwareentwicklung etablierte DevOps-Konzept auf maschinelles Lernen. Mit Machine Learning Operations lässt sich das Entwickeln, Bereitstellen, Verwalten und Überwachen von Machine-Learning-Modellen effizienter gestalten. Data-Science-Prozesse werden in enger Zusammenarbeit der Datenwissenschaftler, Entwickler und Betriebsbereiche operationalisiert. Dank MLOps erzielen Unternehmen schnelleren und größeren geschäftlichen Nutzen aus maschinellem Lernen.
Anbieter zum Thema

MLOps ist die Kurzform für Machine Learning Operations und fasst die drei Bereiche „Machine Learning“ (maschinelles Lernen), „Software Development“ (Softwareentwicklung) und „Operations“ (Betrieb) ein einem gemeinsamen Konzept zusammen. Das aus der Softwareentwicklung bekannte DevOps-Konzept wird auf das maschinelle Lernen übertragen. Es handelt sich bei MLOps quasi um DevOps für Machine Learning.
Ziel von MLOps ist eine effiziente, zuverlässige und qualitativ hochwertige Gestaltung der Entwicklung, Bereitstellung, Verwaltung und Überwachung von Machine-Learning-Modellen. Dank des MLOps-Konzepts lässt sich schnellerer und größerer geschäftlicher Nutzen aus maschinellem Lernen erzielen. Die Data-Science-Prozesse werden in enger Zusammenarbeit der Datenwissenschaftler, Entwickler und Betriebsbereiche funktionsübergreifend operationalisiert.
MLOps automatisiert Prozesse und sorgt für ein kontinuierliches Testen, Überwachen und Validieren der Machine-Learning-Modelle. Entstanden ist MLOps aus der Zusammenstellung einiger Best Practices. Heute ist Machine Learning Operations ein umfassendes Konzept und bildet das komplette Lifecycle-Management für Machine-Learning-Modelle ab. Mit MLOps werden ML-Modelle als Software-Artefakte wiederholt einsetzbar und lassen sich kontinuierlich überwachen.
Lösungen und Tools für Machine Learning Operations
Es existieren mittlerweile zahlreiche Lösungen und Tools für das Lifecycle-Management von Machine-Learning-Modellen. Sie helfen bei der Entwicklung, Bereitstellung, Verwaltung und Überwachung der Modelle. Die Lösungen und Tools können auf proprietärer Software oder auf Open Source Software basieren. Je nach Machine-Learning-Umgebung arbeiten sie auf On-Premises-Systemen oder cloudbasiert. Auch Hyperscaler wie Amazon, Microsoft oder Google bieten für ihre Cloud-Plattformen entsprechende Lösungen, mit denen sich der komplette MLOps-Lebenszyklus cloudnativ abbilden und verwalten lässt. Teils werden vorhandene Dienste aus dem DevOps-Bereich für maschinelles Lernen angepasst. Beispiele für Lösungen und Tools aus dem MLOps-Bereich sind KubeFlow, MLFlow, Algorithmia, Metaflow, Amazon Sage Maker, Azure Machine Learning, Google Cloud AI Platform, HPE Ezmeral ML Ops, Seldon Core, Domino Data Lab, Paperspace Gradient oder DataRobot.
Abgrenzung von MLOps und DevOps
MLOps ist quasi DevOps für maschinelles Lernen und überträgt Teile des DevOps-Konzepts aus dem Softwareentwicklungsbereich auf das Machine Learning. Für ein besseres Verständnis von MLOps zunächst einige grundlegende Informationen zu DevOps. DevOps setzt sich aus den Anfangsbuchstaben der beiden englischen Begriffe „Development“ und „Operations“ zusammen. Development steht für Softwareentwicklung und Operations für IT-Betrieb. Bei DevOps handelt es sich um einen Prozessoptimierungsansatz, der für eine engere Verzahnung und funktionsübergreifende Zusammenfassung von Entwicklungs- und Betriebsprozessen für Software sorgt. Die optimierten Prozesse verbessern die Geschwindigkeit, Agilität, Qualität und Effizienz der Softwareentwicklung und des Betriebs der Software. Es werden Methoden wie Continuous Integration, Continuous Delivery und Continuous Deployment eingesetzt.
Auch bei MLOps geht es um die Steigerung der Geschwindigkeit, Effizienz und Qualität durch Optimierung der Prozesse. Allerdings fokussiert sich MLOps nicht allgemein auf die Softwareentwicklung, sondern auf das maschinelle Lernen und die Entwicklung, Bereitstellung, Verwaltung und Überwachung von Machine-Learning-Modellen. Einige für DevOps erprobte Methoden werden auf die speziellen Anforderungen des maschinellen Lernens angepasst und auf das Machine-Learning-Umfeld übertragen. Dazu gehört zum Beispiel CD4ML (Continuous Delivery for Machine Learning). Im Vergleich zu DevOps zusätzlich zu beachtende Prozessschritte sind beispielsweise das Retraining von Datenmodellen mit neuen Trainingsdaten. Auch im Bereich des Testings gibt es zwischen MLOps und DevOps Unterschiede. Während das DevOps-Testing prinzipiell nur zwei Ergebnisse wie fehlerfrei oder fehlerhaft kennt, werden die Ergebnisse beziehungsweise der Erfolg oder Misserfolg von ML-Modellen in Wahrscheinlichkeiten oder Prozentwerten ausgedrückt. Es gibt keine ML-Systeme, bei denen alle Ergebnisse zu 100 Prozent zutreffend sind.
Der MLOps-Prozess im Detail
Machine Learning Operations bildet mehrere einzelne Machine-Learning-Prozessschritte in einem einzigen übergreifenden und kontinuierlich ablaufenden MLOps-Prozess ab. Der komplette Lebenszyklus der Machine-Learning-Modelle findet in diesem Prozess Berücksichtigung. Die wesentlichen Prozessschritte sind:
- MLOps-Build (Erstellen)
- MLOps-Manage (Verwalten)
- MLOps-Deploy and Integrate (Bereitstellen)
- MLOps-Monitor (Überwachen)
Zu MLOps-Build gehören die Vorbereitung der Daten, das Feature Engineering sowie das Erstellen und Testen der Modelle. Der Prozessschritt MLOps-Manage bildet Tätigkeiten ab wie das Auditing oder die Versionierung der Modelle. Modelle werden dank MLOps-Manage und der Nutzung von Modell-Repositorys wiederverwendbar. Bestandteile von MLOps-Deploy and Integrate sind der Export der Modelle, die Überführung in den produktiven Betrieb sowie die Integration in die entsprechenden Geschäftsanwendungen. MLOps-Monitor sorgt für eine kontinuierliche Überwachung der Modelle und deren Business- und Performance-Metriken. Erkannte Abweichungen sorgen dafür, dass Modelle neu trainiert werden beziehungsweise neue, veränderte oder optimierte Modelle zum Einsatz kommen.
Vorteile durch MLOps
Typische Vorteile durch Machine Learning Operations sind:
- kürzere Entwicklungszyklen – schnellere und agilere Bereitstellung der Modelle
- größerer geschäftlicher Nutzen der ML-Modelle
- höhere Qualität der Modelle
- einfachere Wiederverwendbarkeit der ML-Modelle
- einfachere Überwachung der Modelle
- kontinuierliche Aktualisierung und Anpassung der ML-Modelle
- reduziertes Risiko für unproduktive Modelle
- bessere Zusammenarbeit der Datenwissenschaftler, Entwickler und Betriebsabteilungen
- reduzierter Aufwand durch Automatisierung
- bessere Skalierbarkeit der ML-Modelle
(ID:48299562)