Kommentar von Dr. David James, IT-Novum

Viele Machine-Learning-Projekte scheitern am falschen Framework

| Autor / Redakteur: Dr. David James / Nico Litzel

Der Autor: Dr. David James ist Data Scientist bei IT-Novum
Der Autor: Dr. David James ist Data Scientist bei IT-Novum (Bild: IT-Novum)

Welches Machine Learning Framework passt zu meinem Use Case? Die Antwort auf diese Frage beschäftigt viele Unternehmen, die bei der Auswahl häufig an einen Punkt gelangen, an dem sie nicht mehr weiterkommen. Unterstützung hierbei bietet eine Machine-Learning-Framework-Entscheidungsmatrix, die verschiedene miteinander Frameworks vergleicht.

Deep Learning eignet sich perfekt für die Untersuchung komplexer Daten, wie Bild- und Audiodaten. In der Praxis wird es von vielen Unternehmen aber für Use Cases genutzt, für die andere Frameworks wesentlich besser geeignet wären. Die Erfahrung zeigt, dass die Auswahl des falschen Frameworks der Grund für viele gescheiterte Projekte ist.

Entscheidungsmatrix

Die Entscheidungsmatrix ist eine schnell erfassbare Orientierungshilfe bei der Auswahl eines geeigneten Machine Learning Frameworks für unterschiedliche Use Cases. Sie ist das visuelle Konzentrat von Praxiserfahrungen und Forschungen. Mit ihr ist auf einen Blick erkennbar, welches Framework für einen geplanten Use Case am besten geeignet ist, ohne dass der Verantwortliche sich durch viele Seiten Papier kämpfen muss.

Bei der Erstellung der Matrix wurde berücksichtigt, dass sich die meisten Probleme, die in der Praxis auftreten, in zwei Kategorien unterteilen lassen: Entweder werden Algorithmen benutzt, die für den Use Case nicht oder kaum geeignet sind oder das gewählte Framework kann die aufkommenden Datenmengen nicht bewältigen. Das erste Problem wurde angepackt, indem die verbreitetsten Machine Learning Use Cases in sinnvolle Kategorien unterteilt wurden, für die eine ähnliche Auswahl von Algorithmen und Verfahren zielführend ist. Bei der Auswahl der Frameworks wurden die verbreitetsten Frameworks herangezogen. Auf Basis der Praxisexpertise und von Recherchen wurde bewertet, wie geeignet jedes dieser Frameworks für die einzelnen Use Cases ist. In diesem Zusammenhang wurden Frameworks mit gleichen Eignungen gruppiert.

Small, Big und Complex Data

Eine Unterteilung der Frameworks in Small Data, Big Data und Complex Data ist zwar plakativ, soll aber bei der Auswahl der Frameworks nach Art und Volumen der Daten helfen. Die Grenze zwischen Big Data zu Small Data ist dabei dort zu ziehen, wo die Datenmengen so groß sind, dass sie nicht mehr auf einem einzelnen Computer, sondern in einem verteilten Cluster ausgewertet werden müssen. Wenn von Complex Data die Rede ist, sind vor allem unstrukturierte Daten wie Bild- und Audiodateien gemeint, bei denen Deep Learning Frameworks bestens geeignet sind.

Fünf Expertentipps, wie Sie Ihr Machine-Learning-Projekt richtig anfangen:

  • 1. Klären Sie, ob Sie Machine Learning überhaupt benötigen: Machine Learning Development lohnt sich, wenn Sie Ihr Unternehmen in diese Richtungen verbessern wollen: Vorhersagen treffen, Informationen zusammenfassen und extrahieren, Entscheidungsprozesse unterstützen.
  • 2. Wählen Sie das am besten geeignete Modell: Machine-Learning-Modelle lassen sich grob nach Supervised und Unsupervised unterteilen. Supervised Learning eignet sich z. B. für Churn Prediction, Kredit-Scoring und Marketing-Channel-Optimierung. Unsupervised Learning hilft, Muster in Daten zu finden. Use Cases sind Marketing Clustering, Anomalie-/Betrugserkennung und Textklassifizierung. Deep Learning können Sie sowohl für Supervised als auch Unsupervised Learning einsetzen. Die Techniken eignen sich vor allem für komplexere Daten wie Bilder, Video und Sprache.
  • 3. Unterschätzen Sie nicht die Datenvorbereitung und -bereinigung: Im Schnitt werden Sie fast 80 Prozent der Zeit eines Machine-Learning-Projekts in die Datenaufbereitung investieren. Hier ist nur wenig Automation möglich und viel Know-how gefragt. Durch Entfernen von „noisy“ Daten, Ergänzung fehlender Informationen und Anreicherung der Daten ermöglichen Sie dem Algorithmus, die besten Ergebnisse zu liefern.
  • 4. Entscheiden Sie sich zwischen Machine Learning APIs (Cloud) oder Eigenentwicklung: Die Wahl des richtigen Modells ist eine der Voraussetzungen für den Erfolg eines maschinellen Lernprojekts. Daher sollten Unternehmen das maschinelle Lernen nur dann in die Cloud auslagern, wenn sie sehr spezifische und einfache Aufgaben haben.
  • 5. Finden Sie die richtigen Experten für Ihr Projekt: Wenn Sie sich für eine eigene Machine-Learning-Entwicklung entscheiden, müssen Sie die Experten finden, die zu Ihrem Projekt passen: Data Scientists zur Bereitstellung der Algorithmen. Data Engineers, um Big-Data-Architekturen für das Projekt zu erstellen. Und je nach Anwendungsschwerpunkt zusätzlich Engineers für Bild- oder Spracherkennungsmodelle.

Kommentare werden geladen....

Kommentar zu diesem Artikel abgeben

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 45683520 / Künstliche Intelligenz)