Databricks erweitert MLflow 2.0 um MLflow Recipes

Automatisierte Machine-Learning-Projekte Databricks erweitert MLflow 2.0 um MLflow Recipes

05.12.2022 Von Michael Matzer

Anbieter zum Thema

Databricks Inc.

Disy Informationssysteme GmbH

QUNIS GmbH

Fivetran Germany GmbH

Databricks hat seine auf Apache Spark aufbauende Delta-Lake-Plattform nicht nur deutlich ausgebaut, sondern auch alle Neuerungen der Linux Foundation zur Verfügung gestellt. Zu den wichtigsten Neuerungen zählen MLflow Pipelines für automatisierte Machine-Learning-Projekte und MLflow Recipes, die als Templates fungieren.

Mercedes betreibt mit MLflow die Fehleranalyse bei Fahrzeugen innerhalb von ein bis vier Stunden statt in Tagen. (v. l. n. r.) Judson Althoff, Executive Vice President and Chief Commercial Officer of Microsoft, Jan Brecht, Chief Information Officer der Mercedes-Benz Group AG, Jörg Burzer, Mitglied des Vorstands der Mercedes-Benz Group AG, Produktion und Supply Chain Management. (Bild: Mercedes) — Mercedes betreibt mit MLflow die Fehleranalyse bei Fahrzeugen innerhalb von ein bis vier Stunden statt in Tagen. (v. l. n. r.) Judson Althoff, Executive Vice President and Chief Commercial Officer of Microsoft, Jan Brecht, Chief Information Officer der Mercedes-Benz Group AG, Jörg Burzer, Mitglied des Vorstands der Mercedes-Benz Group AG, Produktion und Supply Chain Management.
(Bild: Mercedes)

Databricks bietet mit seiner Lakehouse-Architektur „Delta Lake 2.0“ nach den Worten von CEO und Mitgründer Ali Ghodsi eine Analyse-Plattform, die hoch performant sowohl strukturierte Daten wie in einem Data Warehouse als auch unstrukturierte Daten wie in einem Data Lake verarbeiten kann – und zwar in jedem Bereitstellungsmodell von on-premises bis Multi-Cloud. Daher wird die Integration mit Services der Public Cloud wie etwa AWS S3 zunehmend enger.

Mit 13 Millionen Downloads pro Monat sei MLflow inzwischen der De-facto-Standard für MLOps, schreiben Craig Wiley und Corey Zuma in ihrem offiziellen Blog. Es sei auch als Managed Service Managed MLflow mit maximaler Zuverlässigkeit und Skalierbarkeit verfügbar. Dieser Service sei mit der Databricks Machine Learning Runtime, Databricks Feature Store und Serverless Real-Time Inference integriert. Die Integration mit Databricks ist also eng, was tausende von Anwendern bestätigen, indem sie MLflow auf Databricks ausführen.

Bildergalerie

Mit diesem Machine-Learning-Modell werden Listenpreise vorhergesagt.(Bild: Databricks)

MLflow 2.0 Recipes wird in einem Web-Video vorgestellt.(Bild: Databricks)

Die Funktion AutoML findet automatisch das passende Modell für die vorliegende ML-Aufgabe. Dabei werden Leistungskennzahlen und Parameter angezeigt, um das eingehendere Tuning und die Iteration zu erleichtern.(Bild: Databricks)

Auf der überarbeiteten MLflow-Experimente-Seite werden die wichtigsten Kennzahlen zur Modelleistung gezeigt, die den User in die Lage versetzen, die besten Durchläufe als Referenz zu speichern, je weiter die Experimentphase voranschreitet. In MLflow 2.0 bekommt jeder Durchlauf einen unverwechselbaren Namen, um ihn leicht identifizieren und nachverfolgen zu können.(Bild: Databricks)

Bildergalerie mit 6 Bildern

Im jüngsten Blogpost verlautbaren sie zudem, dass MLflow 2.0 nun verfügbar geworden sei. MLflow Recipes, das vormals MLflow Pipelines hieß, soll die Modellentwicklung beschleunigen. Mit MLflow Recipes können ML-Experten schnell mit vordefinierten Lösungsrezepten für eine Vielzahl von ML-Modellierungsaufgaben beginnen. Sie können mit der Recipes-Ausführungs-Engine schneller iterieren (Inferenz) und robuste Modelle einfach in die Produktion überführen, indem sie modularen, überprüfbaren Modellcode und Konfigurationen ohne Refactoring bereitstellen. Zu den Erweiterungen von Recipes gehören AutoML, Hyperparameter-Tuning, verbessertes Data Profiling und Support für Klassifizierungsmodelle.

Die Funktion AutoML findet automatisch das passende Modell für die vorliegende ML-Aufgabe. Der Anwender muss nur eine Datenmenge und eine Zielspalte für eine Regression oder Klassifikation angeben und AutoML liefert das passende Modell. Dabei werden Leistungskennzahlen und Parameter angezeigt, um das eingehendere Tuning und die Iteration zu erleichtern. Diese Resultate werden in Machine Learning flow Tracking geloggt, um reproduzierbare Referenzen und Vergleiche zu erhalten.

Der MLflow-Core mit seinen vielen APIs und der Tracking UI wurde aufgrund des Anwender-Feedbacks komplett überarbeitet, um einfacher zu bedienen zu sein und die Produktivität von Data Scientists zu steigern. Während des Trainings von Modellen hat jeder erstellte MLflow-Run jetzt einen eindeutigen, einprägsamen Namen, der dabei hilft, die besten Ergebnisse zu identifizieren. Später kann mit den erweiterten MLflow-Suchfiltern ganz einfach eine Gruppe von MLflow-Läufen nach Namen oder ID abgerufen sowie nach Namen und Tags nach Experimenten gesucht werden.

Die überarbeitete API für das Model Scoring unterstützt die User vor der Bereitstellung eines Modells, indem es erlaubt, weiter gehende Informationen wie etwa regelmäßige Treffsicherheitsprüfungen einzufügen. Im Tracking-Modul wurde die Anzeige für Experimente übersichtlicher gestaltet.

MLflow 2.0 enthält eine überarbeitete Integration mit TensorFlow und Keras, die Protokollierungs- und Bewertungsfunktionalitäten (Logging, Scoring) für beide Modelltypen hinter einer gemeinsamen Schnittstelle vereint. Das modernisierte mlflow.tensorflow-Modul bietet auch eine angenehme Erfahrung für Power-User mit TensorFlow Core APIs, während die Einfachheit für Data Scientists, die Keras verwenden, erhalten bleibt. Die API mlflow.evaluate() erzeugt Reports über die Leistung und Erklärbarkeit eines Modells und zwar für jedes mit MLflow erstellte Modell. Es funktioniert wie AutoML, indem es Leistungsdaten zu vorgegebenen Modell-Parametern liefert. Der User kann vordefinierte Schwellenwerte eingeben, um die Modelleistung daran zu messen. Neue Modelle werden an einer Baseline gemessen, und zwar so lange, bis diese Vorgabe für die Inbetriebnahme erreicht ist. Mehr zu dieser Evaluierungsmethode findet sich in einem Blogpost und in einer Dokumentation auf mlflow.org.

Anwender

Mercedes betreibt mit MLflow die Fehleranalyse bei Fahrzeugen innerhalb von ein bis vier Stunden statt in Tagen und senkt die Fehlerrate, indem es hilft, Defekte zu vermeiden. Zudem erleichtert es das Aufspüren von E-Ladesäulen, indem es dem Fahrer eines EQ-Modells Vorhersagen für die beste Route liefert. Diese Funktion gehört zu den digitalen Services der neuen MO360 Data Platform, die Mercedes zusammen mit Microsoft entwickelt hat.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Geschäftliche E-Mail

Bitte geben Sie eine gültige E-Mailadresse ein.

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Stand: 08.12.2025

Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.

Einwilligung in die Verwendung von Daten zu Werbezwecken

Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.

Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.

Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.

Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.

Recht auf Widerruf

Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.

Rolls-Royce setzt MLflow im Triebwerksbau bereits ein, um Predictive Maintenance zu realisieren. Es vermeidet damit – geplante bzw. ungeplante – Ausfallzeiten, verlängert die Lebensdauer eines Triebwerks und tut etwas für die Nachhaltigkeit seiner Produktion bzw. Wartung.

(ID:48768334)