Auswahl der richtigen Lösung Self-Service-Plattformen für Machine Learning

Autor / Redakteur: Hans-Peter Sailer und Robert Jäschke * / Nico Litzel

Eine der Schlüsseltechnologien zu Innovation im Unternehmen ist Machine Learning (ML): ML unterstützt dabei, Unternehmensressourcen optimal zu verteilen, in Echtzeit datenbasierte Entscheidungen zu treffen oder Entscheidungsunterstützungen bereitzustellen. Die Nutzung von ML-Lösungen erfordert gleichzeitig ein umfassendes Wissen im Bereich Data Science. Experten auf diesem Gebiet sind gefragt.

Firmen zum Thema

Self-Service-Machine-Learning-Plattformen versetzen auch Mitarbeiter mit weniger ausgeprägten Vorkenntnissen in die Lage, Machine-Learning-Modelle zu entwickeln.
Self-Service-Machine-Learning-Plattformen versetzen auch Mitarbeiter mit weniger ausgeprägten Vorkenntnissen in die Lage, Machine-Learning-Modelle zu entwickeln.
(Bild: © everythingpossible - stock.adobe.com)

Um nicht auf dringend benötigte technische Innovationen verzichten zu müssen, sollten die zur Verfügung stehenden Datenexperten auf bestmögliche Weise in ihrer Arbeit unterstützt werden. Self-Service-ML-Plattformen schließen die hier vorhandene Lücke. Ziel dieser Plattformen ist es, auch Mitarbeitern mit weniger ausgeprägten Vorkenntnissen die Entwicklung von ML-Modellen zu ermöglichen, Data Scientists in ihrer Arbeit zu unterstützen und die Nutzung von ML-Modellen allgemein in den Unternehmen zu vereinfachen.

Eine sorgfältig ausgewählte Self-Service-ML-Plattform kann die Entwicklung eines Unternehmens im Bereich ML in erheblichem Maße positiv beeinflussen. Allerdings werden am Markt sehr viele verschiedene Varianten angeboten, sodass die Auswahl der richtigen Lösung schwierig ist. Was spielt eine Rolle bei der Auswahl von Self-Service-ML-Plattformen? Ein Überblick über die wichtigsten Merkmale von Self-Service-ML-Plattformen:

Berücksichtigung der Ziele und Anforderungen

Unternehmen, die über die Einführung einer Self-Service-ML-Plattform nachdenken, verfolgen damit in der Regel mindestens eines der folgenden Ziele:

  • Produktivitätssteigerung ihrer Teams, die an ML-Anwendungsfällen arbeiten, durch Verbesserung des Use Case Lifecycle Managements, Beschleunigung des Trial-and-Error-Prozesses und Umgestaltung des Entwicklungsprozesses für Anwendungsfälle, sodass dieser weniger fehleranfällig wird.
  • Senkung der Anforderungen im Hinblick auf die Qualifikation der Mitarbeiter für die Entwicklung von ML-Anwendungsfällen, um den Anteil datenbasierter Entscheidungen und Prozesse im Unternehmen zu erhöhen.
  • Erleichterung der Zusammenarbeit zwischen Teammitgliedern durch Zugänglichkeit von Self-Service-ML-Plattformen für unterschiedliche Qualifikationsniveaus innerhalb des Teams.
  • Unterstützung bei der Produktivsetzung und Verwaltung von ML-Anwendungsfällen zur Realisierung der gewünschten Geschäftsvorteile.

Der Markt bietet verschiedene Self-Service-ML-Tools, deren Funktionen einige oder alle dieser Ziele abdecken. Es ist von Vorteil, sich für eine Self-Service-ML-Plattform zu entscheiden, die alle Zielsetzungen erfüllt. Auch die Entwicklungsteams werden eine solche Plattform zu schätzen wissen. Allerdings sind die leistungsstärksten Plattformen auch die teuersten, vor allem was die laufenden Lizenzgebühren angeht. Unternehmen müssen sich daher fragen, welche Ziele sie verfolgen und in welchem Maße die Self-Service-ML-Plattform dazu beitragen soll, um sich während der Evaluierungsphase auf die besonders wichtigen Anforderungen konzentrieren zu können.

Die wichtigsten Merkmale

Self-Service-ML-Plattformen können die wichtigsten Anforderungen in ML-Anwendungsfallentwicklung unterstützen.

Modellentwicklung: Im ersten Schritt des Entwicklungszyklus müssen ML-Modelle mithilfe von für den Anwendungsfall relevanten Datensätzen trainiert werden. Self-Service-ML-Plattformen bieten sofort einsetzbare und parametrisierbare Modelle, die über eine grafische Benutzerschnittstelle verwendet werden können. Die meisten Plattformen unterstützen zumindest das Anlernen von einem Out-of-the-box-Modell zu einem gegebenen Zeitpunkt.

Ausgereiftere Self-Service-ML-Plattformen bieten eine Empfehlungs-Engine, die dem Kunden aufzeigt, welche ML-Modelle sich für einen bestimmten Anwendungsfall eignen. Es ist auch möglich, für einen Anwendungsfall mehrere ML-Modelle parallel zu trainieren.

Self-Service-ML-Plattformen im obersten Leistungsspektrum bieten eine Funktion, die man als „Auto ML“ bezeichnen kann. Hier wird der passende Algorithmus für das Anlernen des ML-Modells für den jeweiligen Anwendungsfall automatisch ausgewählt. Zudem können sie Funktionen für individuell entwickelte ML-Modelle in verschiedenen Programmiersprachen wie R, Python oder Julia enthalten.

Modellbewertung: Um die Leistung von ML-Modellen zu bewerten, bieten Self-Service ML-Plattformen im unteren Leistungsspektrum Berichte mit entsprechenden Gütemaßen. Self-Service ML-Plattformen ermöglichen einen direkten Vergleich zwischen allen parallel angelernten Modellen, sodass das jeweils beste Modell für den entsprechenden Anwendungsfall ausgewählt werden kann. Plattformen im obersten Leistungsspektrum mit Auto-ML-Kapazität wählen automatisch das optimale Modell.

Visualisierung: Im Rahmen des Entwicklungszyklus ist es wichtig, die Rohdaten sowie die vorbereiteten Eingabedaten zu analysieren und sich ein eindeutiges Bild von den Lernergebnissen des ML-Modells zu machen. Die Visualisierungsfunktionalität von Self-Service-ML-Plattformen sind daher von entscheidender Bedeutung. Die Plattformen sollten in der Lage sein, die Endergebnisse so zu präsentieren, dass eine schnelle Entscheidungsfindung möglich ist.

Die Funktionalitäten der verschiedenen Plattformen reichen dabei von einer einfachen grafischen Darstellung bis hin zu Implementierungen ähnlich wie bei Self-Service-BI-Tools, die auch eine schnelle Visualisierung komplexer Sachverhalte ermöglichen.

Bereinigung und Vorbereitung der Daten: Die Trainingsdaten für ein ML-Modell müssen aus unterschiedlichen Quellen gewonnen und in geeignete Datensätze umgewandelt werden. Self-Service-Plattformen bieten ähnliche Funktionen wie ETL-Tools und zusätzliche ML-spezifische Funktionen für die Datenbereinigung und -vorbereitung.

Plattformen mit Auto-ML-Funktionen können diese Aufgaben auch teilweise oder vollständig automatisiert ausführen. Zudem bieten Self-Service-ML-Plattformen die Option, in der Datenbereinigung und -vorbereitung Code zu verwenden und Berechnungen an eine Datenbank oder ein Cluster weiterzureichen, um eine schnellere Bearbeitung zu ermöglichen.

Zusammenarbeit: Bei der Auswahl einer Self-Service ML-Plattform müssen die im Team vorhandenen Kompetenzen sehr sorgfältig berücksichtigt werden. Um die Zusammenarbeit zu verbessern, verfügen einige Self-Service-ML-Plattformen über integrierte Kollaborationsfunktionen. Häufig angebotene Funktionen sind die Versionskontrolle, der Austausch von Arbeitsergebnissen, Kommentarfunktionen, To-Do-Listen, Nutzung von No-Code/Low-Code oder Code und Wissensaustauschfunktionen.

Während Data Scientists und Data Engineers über Code und Code-Repositories zusammenarbeiten können, arbeiten Business-Analysten eher mit No-Code-, Low-Code- und Visualisierungsfunktionen. Wenn Data Scientists, Data Engineers und Business-Analysten zusammenarbeiten, sollten die Kollaborationsfunktionen für alle beteiligten Rollen geeignet sein.

Operationalisierung von ML-Anwendungsfällen: Die Operationalisierung von ML-Anwendungsfällen ist eine komplexe Aufgabe. ML-Anwendungsfälle müssen in Geschäftsprozesse integriert und die Ergebnisse für Analysen und Berichte bereitgestellt werden. Self-Service ML-Plattformen bieten Funktionen zur Bereitstellung von ML-Modellen als API. Auf diese Weise können sie in Echtzeit von Drittsystemen genutzt werden. Die ML-Modelle werden dabei exportiert, sodass sie innerhalb der bestehenden IT-Infrastruktur eingesetzt werden können. Ein weiteres Beispiel ist die geplante automatische Ausführung eines ML-Modells, um Ergebnisse automatisch einem nachfolgenden System zur Verfügung zu stellen.

Self-Service ML-Plattformen mit diesen Funktionen ermöglichen, ML-Modelle in den Geschäftsablauf einzubinden, und reduzieren den Administrationsbedarf. Um einen Geschäftsvorteil zu erzielen, müssen die ML-Modelle in die technischen Prozesse integriert werden, wodurch zusätzlich Aufwände in den beliefernden als auch konsumierenden Systemen anfallen.

Monitoring: Dieser Punkt muss aus zwei Blickwinkeln betrachtet werden: Zunächst geht es dabei um das technische Monitoring, also die Beobachtung des Status der verschiedenen technischen Komponenten oder Jobs. Mit jedem Operationalisierungsansatz (wie oben genannt) müssen auch die entsprechenden Monitoring-Funktionalitäten Hand in Hand gehen.

Zweitens ist auch das Monitoring im Hinblick auf geschäftliche Kennzahlen wichtig, das von einigen ausgereifteren Self-Service-ML-Plattformen ebenfalls unterstützt wird. Diese arbeiten mit einem Closed-Loop-Ansatz, um herauszufinden, ob sich die Anwendung eines ML-Modells als hilfreich erwiesen hat oder nicht. Dabei muss man aber bedenken, dass ein solches KPI-Monitoring in die technischen Prozesse eingebettet werden muss und von der Self-Service ML-Plattform nicht allein gelöst werden kann.

Reife zum Enterprise-Einsatz: Die Anforderungen an Self-Service-ML-Plattformen in großen Unternehmen unterscheiden sich von denen kleiner Unternehmen in Sachen Sicherheit, Zugangsmanagement, Governance und Verfügbarkeit. Je mehr Mitarbeiter und Teams aus unterschiedlichen Geschäftsbereichen oder Projekten beteiligt sind, desto höher ist der Aufwand für die Administration sowie für den Schutz der wertvollen Vermögenswerte des Unternehmens. Diese Anforderungen werden von Self-Service ML-Plattformen auf Enterprise-Niveau abgedeckt, die beispielsweise LDAP-Integration (Lightweight Directory Access Protocol), Multi-User Security, Benutzermanagement, Revisionsfunktionen, Fehlertoleranzen und Skalierbarkeit bieten.

Fazit

Die Bandbreite der angebotenen Self-Service-ML-Kapazitäten und ihrer Realisierungen ist sehr umfangreich und die vollständige Liste an Funktionen noch länger. Das macht die Beurteilung von Self-Service-ML-Plattformen zu einer komplexen Aufgabe, bei der Anforderungen bewertet werden müssen, die auch folgende Gesichtspunkte abdecken:

  • Strategie: Das Portfolio an ML-Anwendungsfällen, die realisiert werden sollen, und die damit verbundenen Geschäftsszenarien sowie die geplante Markteinführungszeit sind wichtige Parameter.
  • Organisation: Hier spielen die Organisationsstruktur, das Qualifikationsspektrum innerhalb des/der ML-Entwicklungsteams sowie natürlich das Geschäftsmodell eine wichtige Rolle.
  • Architektur: Für die Integration und den reibungslosen Betrieb einer solchen Plattform innerhalb der IT-Umgebung eines Unternehmens sollten architektonische Richtlinien sowie die Abdeckung von Qualitätsattributen wie Skalierbarkeit, Erweiterbarkeit, Sicherheit, Portierbarkeit, Fehlertoleranz und Verfügbarkeit berücksichtigt werden.

Diese Aspekte sind besonders wichtig, um zu garantieren, dass die ausgewählte Self-Service-ML-Plattform den besonderen Anforderungen des Unternehmens gerecht wird. Ansonsten wären bereits entwickelte ML-Anwendungsfälle auf der Self-Service ML-Plattform „gefangen“ und müssten mit zusätzlichem Aufwand neu entwickelt werden. Zudem fallen bereits Kosten durch laufende Lizenzgebühren an. Diesem Risiko kann man mit Unterstützung durch externe Expertise entgegentreten, um die passende Self-Service-Machine-Learning-Plattform für das eigene Unternehmen zu identifizieren und die erfolgreiche Einführung sicherzustellen. Des Weiteren kann bei der Entwicklung der initialen Machine Learning-Anwendungsfälle durch externe Unterstützung ein sogenanntes „Training-on-the-Job“ durchgeführt werden und ein schneller erster Erfolg erzielt werden.

* Hans-Peter Sailer ist Partner Machine Learning Reply und Robert Jäschke ist Senior Consultant Machine Learning Reply

(ID:47141813)