Definition Was ist Midjourney?
Anbieter zum Thema
Midjourney ist eine generative Künstliche Intelligenz. Der Text-zu-Bild-Generator erstellt auf Basis von Anweisungen in Textform hochauflösende Bilder, Gemälde, Zeichnungen, Fotos und andere Arten digitale Bilder. Nutzbar ist Midjourney über Textanweisungen (Prompts) an einen Discord-Bot. Die grundsätzliche Funktionalität von Midjourney ist vergleichbar mit anderen Text-zu-Bild-Generatoren wie DALL-E oder Stable Diffusion.

Midjourney ist der Name einer generativen Künstlichen Intelligenz, die auf Anweisung in Textform (Prompts) digitale Bilder erstellt. Der Text-zu-Bild-Generator wurde vom gleichnamigen Forschungsinstitut entwickelt. David Holz hat das Forschungsinstitut Midjourney gegründet. Es hat seinen Sitz im kalifornischen San Francisco.
Im Juli 2022 wurde Midjourney in Form einer offenen, von jedem nutzbaren Beta-Version veröffentlicht. Seither wurde der KI-Text-zu-Bildgenerator kontinuierlich weiterentwickelt und verbessert. Im März 2023 erfolgte mit der Version 5 der Übergang zu einer ersten Alpha-Version. Ab der Version 5.2 ist die Bildqualität von Midjourney nochmals deutlich verbessert. Inzwischen werden Funktionen wie Outpainting und Zoom-out unterstützt.
Noch bis März 2023 konnte Midjourney von jedem kostenlos ausprobiert werden. Aufgrund von zu ausufernder missbräuchlicher Nutzung des KI-Bildgenerators, zum Beispiel für Deepfakes, ist die kostenlose Nutzung nicht mehr möglich. Es ist eine Registrierung und die Auswahl eines Abonnement-Plans erforderlich. Für die zahlenden User stehen drei verschiedene Abo-Modelle mit unterschiedlichen monatlichen Kosten und gewährten Rechenzeiten zum Erstellen von Bildern zur Verfügung (Stand September 2023). Pro Bild ist ungefähr eine Minute Rechenzeit notwendig. Die grundsätzliche Funktionalität von Midjourney ist vergleichbar mit anderen Text-zu-Bild-Generatoren wie DALL-E von OpenAI oder Stable Diffusion von Stability AI.
Die grundlegenden Fähigkeiten von Midjourney
Midjourney versteht natürlichsprachige Textanweisungen und bevorzugt die englische Sprache. Er lässt sich aber auch mit Prompts in anderen Sprachen wie in Deutsch nutzen. Auf Basis der Textangaben erstellt die KI neue Bilder. Midjourney beherrscht verschiedene Bildarten und Stilrichtungen. Es lassen sich zum Beispiel fotorealistische Bilder und Gemälde oder Zeichnungen in verschiedenen Stilen erzeugen. Inhalte der Bilder können Menschen, Tiere, Comicfiguren, Gegenstände, Landschaften oder fiktive Szenen und vieles mehr sein. Neben dem Erzeugen neuer Bilder beherrscht Midjourney inzwischen auch die nachträgliche Bearbeitung existierender Bilder wie das Verändern bestimmter Bildbereiche oder des Bildhintergrunds.
Die Nutzung von Midjourney
Die Bild-KI ist über Textanweisungen an einen Discord-Bot auf einem Discord-Server nutzbar. Es ist dafür ein Discord-Account und ein kostenpflichtiger Abo-Plan von Midjourney notwendig. Anschließend kann man über einen Midjourney-Discord-Server mit dem Bildgenerator arbeiten. Über den vorangestellten Befehl „/imagine“ wird dem Bot signalisiert, dass ein Bild erstellt werden soll. Die Text-Prompts teilen der Künstlichen Intelligenz mit, welche Art von Bild mit welchen Inhalten und in welchem Stil und Seitenverhältnis erzeugt werden soll. Die Anweisungen können in Englisch, aber auch in Deutsch und in anderen Sprachen gegeben werden.
Die KI liefert auf Basis des Prompts vier Bildvorschläge, von denen ein Bild für das Upscaling ausgewählt und über weitere Anweisungen verändert oder angepasst werden kann. Gefällt keines der Bildvorschläge, erzeugt Midjourney auf Befehl weitere Bildentwürfe. Mittlerweile sind als Eingaben neben Textanweisungen auch selbst hochgeladene Bilder in Formaten wie PNG, GIF und JPG oder Bilder-URLs möglich. Damit arbeitet Midjourney prinzipiell auch als Bild-zu-Bild-Generator.
Das von Midjourney fertiggestellte Bild kann der Nutzer sich in Originalgröße anzeigen lassen, herunterladen und lokal speichern. Um zu verhindern, dass mit Midjourney unerwünschte oder schädliche Inhalte wie Bilder mit pornografischen oder gewaltverherrlichenden Darstellungen generiert werden, haben die Entwickler einige Sicherheitsmaßnahmen implementiert. Midjourney arbeitet mit einem „Banned-Word-System“ und ist inzwischen mit einem KI-unterstützten „Content-Moderation-System“ ausgestattet, das die Textanweisungen analysiert und interpretiert. Bei Verwendung von bestimmten Wörtern, Ausdrücken, Befehlen oder Inhalten in den Prompts unterbindet Midjourney das Generieren von Bildern.
Vor- und Nachteile von Midjourney
Die aktuelle Version von Midjourney ist vielseitig und liefert Bilder in hoher Qualität. Unter anderem ist die Darstellung von existierenden Personen sehr gut. In den öffentlichen Discord-Rooms kann man von Prompts und Ergebnissen der Community lernen.
Als Nachteile von Midjourney lassen sich aufführen:
- keine Open Source Software
- Nutzung ist kostenpflichtig
- beschränkte API-Zugangsmöglichkeiten
- in öffentlichen Discord-Rooms werden Anweisungen und Bilder mit anderen Midjourney-Nutzern geteilt
- wie bei anderen KI-Text- oder -Bild-Generatoren existieren zahlreiche ungeklärte Rechtsfragen hinsichtlich Nutzungs- und Urheberrechten sowie des verwendeten Trainingsmaterials
- Bias im Trainingsmaterial beeinflusst die Bilderzeugung
- eine missbräuchliche Nutzung des KI-Bildgenerators, zum Beispiel für Deepfakes oder Desinformationskampagnen, lässt sich nicht gänzlich verhindern
- generative KI benötigt für Training und Betrieb hohen technischen Aufwand und verbraucht viel Energie
- generative Bild-KI hat Einfluss auf den Arbeitsmarkt und kann zum Verlust von Arbeitsplätzen in Bereichen wie Grafikdesign, Fotografie oder Kunst führen
(ID:49721194)