Suchen

Definition Was ist Amazon SageMaker?

| Autor / Redakteur: Dipl.-Ing. (FH) Stefan Luber / Nico Litzel

Amazon SageMaker ist ein voll verwalteter Cloud-Service von Amazon, der im Rahmen der Amazon Web Services (AWS) verfügbar ist. Mithilfe des Dienstes lassen sich Machine-Learning-Modelle schneller und einfacher erstellen, trainieren und für produktive Zwecke bereitstellen. Genutzt wird Amazon SageMaker beispielsweise von Datenwissenschaftlern oder Entwicklern.

Firma zum Thema

(Bild: © aga7ta - stock.adobe.com)

Bei Amazon SageMaker handelt es sich um einen voll verwalteten Machine-Learning-Service auf Basis der Cloud-Infrastruktur von Amazon. Er wird im Rahmen der Amazon Web Services angeboten und ist über das Internet nutzbar. Ziel von Amazon SageMaker ist es, das Erstellen, Trainieren und Bereitstellen von Machine-Learning-Modellen für Entwickler und Datenwissenschaftler zu vereinfachen, zu beschleunigen und die Kosten zu reduzieren.

Sämtliche Einzelschritte der Machine-Learning-Prozesse werden von Amazon SageMaker unterstützt. Das reicht von der Datenerkundung und -aufbereitung über das Erstellen und Trainieren der Modelle bis zum Echtbetrieb eines trainierten Modells. Für die Einzelphasen des Machine-Learning-Zyklus stehen Tools mit webbasierten Benutzeroberflächen zur Verfügung. Auch der Einsatz von Machine-Learning-Modellen auf Endgeräten und Embedded Systems wird unterstützt. Gestartet ist Amazon SageMaker im Jahr 2017. Der Service basiert auf einen nutzungsabhängigen Kostenmodell. Weitere Merkmale von Amazon SageMaker sind die Unterstützung von Jupyter-Notebooks, gute Skalierungsmöglichkeiten und die Kompatibilität mit führenden Deep-Learning-Frameworks wie Apache MXNet, TensorFlow, PyTorch, Keras, Horovod und andere.

Der Funktionsumfang von Amazon SageMaker

Amazon SageMaker bietet einen großen Funktionsumfang, der Entwickler und Datenwissenschaftler in verschiedenen Phasen und auf unterschiedlichen Funktionsebenen des Machine Learnings unterstützt. Auf der obersten Ebene stellt SageMaker bereits vortrainierte Machine-Learning-Modelle bereit, die sich direkt für eigene Anwendungen einsetzen lassen. Als weitere Funktionsebene beinhaltet SageMaker diverse Machine-Learning-Algorithmen, mit denen sich Modelle trainieren lassen. Zur Erstellung eigener Machine-Learning-Algorithmen sind Deep-Learning-Frameworks wie Apache MXNet oder TensorFlow nutzbar.

Amazon SageMaker ist vollständig in die Amazon Web Services integriert und erlaubt die Anbindung und Verwendung anderer AWS-Services wie Datenbanken, Batchprozessing oder Amazon Kinesis (Erfassung, Verarbeitung und Analyse von Streaming-Daten in Echtzeit). Trainierte Modelle sind mit geringem Aufwand und wenigen Klicks für den Echtbetrieb in verschiedenen Amazon Availability Zones bereitstellbar. Anwendungen können sich über API-Aufrufe mit den Machine-Learning-Instanzen verbinden

Komponenten und Tools von Amazon SageMaker

Amazon SageMaker besteht aus einer Vielzahl verschiedener Komponenten und Tools, die teilweise über webbasierte grafische Oberflächen nutzbar sind. Wichtige Bestandteile sind unter anderem:

  • Amazon SageMaker Studio
  • Amazon SageMaker Autopilot
  • Amazon SageMaker Notebooks
  • Amazon SageMaker Modell Monitor
  • Amazon SageMaker Experiments
  • Amazon SageMaker Neo
  • Amazon SageMaker Debugger
  • Amazon SageMaker Ground Truth

Amazon SageMaker Studio stellt eine webbasierte Benutzeroberfläche zur Verfügung, in der die einzelnen Arbeitsschritte des Machine Learnings ausgeführt werden. Es ermöglicht die Kontrolle, Steuerung und den Einblick in die Prozesse des Erstellens, des Trainierens und des Bereitstellens der Modelle. Mit Amazon SageMaker Studio lassen sich über eine einheitliche Benutzeroberfläche beispielsweise Notebooks erstellen, Modelle optimieren oder Machine-Learning-Prozesse debuggen.

Amazon SageMaker Autopilot gestattet das automatische Erstellen, Trainieren und Optimieren von Machine-Learning-Modellen mit vollständiger Sichtbarkeit. Mithilfe des Autopilots lassen sich Rohdaten automatisiert prüfen, optimale Algorithmen wählen und die Leistungen der Modelle verfolgen. Der Autopilot ermöglicht die Auswahl des für einen bestimmte Anwendung am besten geeigneten Modells.

Der Amazon SageMaker Modell Monitor erlaubt die Erkennung von Konzeptabweichungen implementierter Modelle und die Behebung der Abweichungen. Amazon SageMaker Ground Truth ist zum Erstellen und Verwalten von Trainingsdatensätzen vorgesehen. Amazon SageMaker Experiments ermöglicht die Organisation und Nachverfolgung der Iterationen der Machine-Learning-Modelle, indem Ergebnisse, Eingangsparameter und Konfigurationen automatisch erfasst und gespeichert werden. Mit dem Amazon SageMaker Debugger werden Trainingsprozesse transparenter. Metriken des Debuggers lassen sich über das SageMaker Studio visualisieren.

Amazon SageMaker und Jupyter-Notebooks

Amazon SageMaker integriert und unterstützt das Konzept der Jupyter-Notebooks. Jupyter-Notebooks sind Open-Source-Webanwendungen und enthalten die notwendigen Libraries, Treiber und Pakete für die jeweiligen Deep-Learning-Frameworks. Sie laufen in einer Notebook-Instanz. In Amazon SageMaker sind viele vordefinierte Notebooks für unterschiedliche Anwendungsfälle verfügbar.

Das Kostenmodell von SageMaker

Amazon SageMaker basiert auf einem nutzungsabhängigen Abrechnungsmodell. Es entstehen nur Kosten für tatsächlich verwendete Ressourcen. Mindestgebühren oder Vorausleistungen sind nicht zu zahlen. Die Preise setzen sich aus den genutzten ML-Instanzen, dem genutzten Speicher, den Trainingszeiten und der Menge an Daten zusammen. Das Deployment der Modelle verursacht ebenfalls Kosten.

Vorteile von Amazon SageMaker

Die Vorteile durch den Einsatz von Amazon SageMaker sind, kurz zusammengefasst, folgende:

  • schnelleres und einfacheres Erstellen, Trainieren und Bereitstellen von Machine-Learning-Modellen
  • voll verwalteter Webservice
  • über das Internet nutzbar
  • Unterstützung sämtlicher Zyklen des Machine-Learning-Prozesses
  • geeignet für Entwickler und Datenwissenschaftler
  • gute Skalierbarkeit
  • Unterstützung zahlreicher Deep-Learning-Frameworks
  • Unterstützung von Jupyter-Notebooks
  • nutzungsabhängiges Abrechnungsmodell
  • Nutzung über webbasierte Benutzeroberfläche möglich

(ID:46310567)

Über den Autor