Definition Was ist AWS DeepComposer?

Autor / Redakteur: Dipl.-Ing. (FH) Stefan Luber / Nico Litzel

Der AWS DeepComposer ist ein Cloud-Dienst von Amazon, der die mit einem physischen oder mit einem softwarebasierten Keyboard eingespielten Melodien mithilfe Künstlicher Intelligenz mit Begleitspuren erweitert und komplette Musikstücke erstellt. Der Service ist für Entwickler vorgesehen, um ihnen das Machine Learning und Generative KI näher zu bringen.

Firma zum Thema

(Bild: © aga7ta - stock.adobe.com)

AWS DeepComposer ist die Produktbezeichnung eines von Amazon im Rahmen der Amazon Web Services (AWS) erbrachten Cloud-Dienstes. Er wird von Amazon voll gemanagt und ist speziell für Entwickler vorgesehen. Der AWS DeepComposer soll den Entwicklern das Machine Learning und Generative Künstliche Intelligenz näher zu bringen und ihnen einen schnellen Einstieg in diese Art der KI ermöglichen.

Mithilfe des DeepComposers lassen sich Melodien KI-gestützt zu vollständigen Musikstücken erweitern, indem Begleitspuren automatisch im gewünschten Musikstil ergänzt werden. Die Ausgangsmelodien lassen sich über ein bei Amazon erhältliches physisches Keyboard oder ein virtuelles, softwarebasiertes Keyboard einspielen. Auch MIDI-Dateien sind als Ausgangsmaterial nutzbar. Zur Schulung der Entwickler stellt der AWS DeepComposer Tutorials und zahlreiche Beispiele bereit.

Dem DeepComposer liegt das Funktionsprinzip Generativer Künstlicher Intelligenz unter Verwendung Generative Adversarial Networks (GANs) zugrunde. Für das Komponieren von Musikstücken muss kein Programmcode erstellt werden. Fertige Musikstücke lassen sich aus dem DeepComposer heraus in SoundCloud veröffentlichen. Über den AWS DeepComposer Chartbuster ist die Teilnahme an Wettbewerben möglich. Das Preismodell für den AWS DeepComposer ist nutzungsabhängig. Es fallen weder Mindestgebühren noch Vorabkosten an. Die Abrechnung erfolgt auf Basis der angefallenen Stunden für das Training und die Inferenz. Für den Einstieg und das Testen des Services steht ein kostenloses Kontingent zur Verfügung. Das physische DeepComposer Keyboard ist in den USA über Amazon.com erhältlich.

Generative Adversarial Networks (GANs)

Dem AWS DeepComposer liegt das Funktionsprinzip Generativer Künstlicher Intelligenz zugrunde. Es handelt sich um eine speziell Art des Machine Learnings, bei der zwei Künstliche Neuronale Netzwerke (KNN) miteinander interagieren und voneinander lernen. Ein Generative Adversarial Network (GAN) besteht aus einem Generator und einem Diskriminator. Aufgabe des Generators ist es, Daten künstlich zu erzeugen, die von Originaldaten nicht mehr zu unterscheiden sind. Im Fall des DeepComposers erzeugt der Generator die Musikstücke mit den Begleitspuren. Das Ergebnis wird dem Diskriminator vorgelegt, der die Kreationen des Generators bewertet. In mehrfachen Iterationen optimiert der Generator anhand der vom Diskriminator erhaltenen Rückmeldungen die erstellten Daten (Musikstücke) mit dem Ziel, dass der Diskriminator diese nicht mehr von Originaldaten (echten Musikstücken) unterscheiden kann. Die beiden Künstlichen Neuronalen Netzwerke konkurrieren untereinander. Der Generator versucht den Diskriminator zu „überlisten“ und der Diskriminator den Generator beim Erzeugen von Nicht-Originaldaten zu „ertappen“.

Generative Adversarial Networks lassen sich überall dort einsetzen, wo Inhalte erzeugt werden sollen, die von echten Inhalten nicht mehr zu unterscheiden sind. Diese Art des Machine Learnings ist prädestiniert für das Erstellen von Deepfakes. Generative KI erzeugt oder ergänzt beispielsweise Texte, Fotos, Gemälde, Videos, Designs – oder wie im Fall des AWS DeepComposers Musikstücke.

Nutzung des AWS DeepComposers

Zum Erstellen eines Musikstücks im gewünschten Musikstil benötigt der AWS DeepComposer eine Melodie als Ausgangsmaterial. Diese Melodie lässt sich auf verschiedene Art bereitstellen. Sie kann über das käuflich erhältliche physische Keyboard oder über ein in der AWS-Konsole virtuell emuliertes Keyboard eingespielt werden. Darüber hinaus lassen sich MIDI-Daten als Ausgangsmaterial verwenden. Die Eingabe von Melodien über das Keyboard wird durch Funktionen wie Rhythm Assist unterstützt. Um die Begleitspuren und das Musikstück vom DeepComposer erzeugen zu lassen, kann einer der vorgegebenen Musikstile Rock, Pop, Jazz und Klassik oder ein selbst erzeugtes Genre ausgewählt werden.

Entsprechend der Auswahl erstellt der AWS DeepComposer die Begleitspuren verschiedener Instrumente für die eingespielte Melodie. Begleitspuren sind beispielsweise Schlagzeug, Bass oder Gitarre. Das fertige Musikstück kann direkt aus dem DeepComposer auf SoundCloud hochgeladen oder im MIDI-Format exportiert werden. Auf Wunsch nehmen die erzeugten Musikstücke an monatlichen Wettbewerben im AWS DeepComposer Chartbuster teil. Die Songs konkurrieren mit anderen Kreationen und werden entsprechend ihrer Beliebtheit in Charts gelistet. Darüber hinaus sind im AWS DeepComposer Chartbuster Preise für die besten Musikstücke ausgelobt.

Lernmöglichkeiten für Entwickler

Ziel des AWS DeepComposers ist es, Entwicklern das Machine Learning zu bringen und einen einfachen Einstieg in die Generative Künstliche Intelligenz zu ermöglichen. Hierfür bietet der DeepComposer den Entwicklern sogenannte Learning Capsules. Die Learning Capsules enthalten Tutorials, die das Verstehen, Erlernen und Anwenden Generativer KI erleichtern. Sie sind in kurze, leicht verständliche Module aufgeteilt. Den Entwicklern stehen zudem Beispiel-Notebooks von Amazon SageMaker für ein vertieftes Einarbeiten in das Themengebiet Generativer KI zur Verfügung.

(ID:47507860)

Über den Autor