Alibaba Cloud hat auf der World Artificial Intelligence Conference 2023 in Shanghai ein KI-gestütztes bildgenerierendes Modell vorgestellt: „Tongyi Wanxiang“ könne, basierend auf Textaufforderungen in Englisch oder Chinesisch, detailreiche Bilder in vielen Stilen erschaffen.
So interpretiert Tongyi Wanxiang „eine Stadtlandschaft in der Dämmerung, eine Welt, die moderne Architektur mit der Ästhetik des Anime verbindet“.
(Bild: Alibaba Cloud)
Das generative KI-Modell Tongyi Wanxiang greife auf verschiedene Technologien von Alibaba Cloud aus den Bereichen Wissensordnung, visueller KI und Natural Language Processiong (NLP) zurück. Damit seien „Zehntausende Bilder“ möglich – so jedenfalls übersetzt der Hersteller „Wanxiang“. Das Modell stehe Unternehmenskunden in China zum Betatest zur Verfügung.
Darüber hinaus präsentiert der Cloud-Anbieter „ModelScopeGPT“. Das Framework soll Anwender bei der Bewältigung komplexer und spezialisierter KI-Aufgaben in den Bereichen Bild- und Sprachverarbeitung unterstützen, indem es verschiedene KI-Modelle auf ModelScope nutzt. Die quelloffene Model-as-a-Service-Plattform (MaaS) wurde 2022 von Alibaba Cloud eingeführt und umfasse derzeit mehr als 900 KI-Modelle.
Vom Text zum Bild
Tongyi Wanxiang zufolge ist dies „ein Ring aus leuchtenden Farben vor einer herrlichen Landschaft“.
(Bild: Alibaba Cloud)
Tongyi Wanxiang könne aus Texteingaben in Chinesisch und Englisch detaillierte Bilder in einer Reihe von Stilen – von Aquarell- und Ölmalerei bis hin zu Skizzen und 3-D-Cartoons. Darüber hinaus sei es möglich, den Inhalt eines Originalbildes beizubehalten und gleichzeitig den visuellen Stil eines anderen Bildes anzuwenden.
Durch die Optimierung des hochauflösenden Diffusionsprozesses auf der Grundlage des Signal-Rausch-Verhältnisses könne das Modell ein Gleichgewicht zwischen Kompositionsgenauigkeit und Detailschärfe herstellen und gleichzeitig seine Fähigkeit zur Erzeugung kontrastreicher, visuell beeindruckender Bilder mit sauberen Hintergründen verbessern, so Alibaba Cloud.
Für die Entwicklung von Tongyi Wanxiang habe der Hersteller das firmeneigene Modell Composer verwendet.
ModelScopeGPT für anspruchsvolle KI-Aufgaben
Mit ModelScopeGPT sei es möglich, die Fähigkeiten der auf der ModelScope-Plattform verfügbaren Large Language Models (LLMs) auszuschöpfen. Unternehmen und Entwickler könnten ModelScopeGPT kostenlos nutzen, damit auf die am besten geeigneten Modelle zugreifen und diese für die Durchführung anspruchsvoller KI-Aufgaben auf der Grundlage von Benutzeranfragen nutzen, z. B. für die Erstellung mehrsprachiger Videos.
(ID:49612038)
Stand vom 30.10.2020
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von redaktionellen Newslettern nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://support.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung, Abschnitt Redaktionelle Newsletter.