KI-Modell von Alibaba Cloud Bildgenerator Tongyi Wanxiang startet in China

Von Bernhard Lück Lesedauer: 1 min

Anbieter zum Thema

Alibaba Cloud hat auf der World Artificial Intelligence Conference 2023 in Shanghai ein KI-gestütztes bildgenerierendes Modell vorgestellt: „Tongyi Wanxiang“ könne, basierend auf Textaufforderungen in Englisch oder Chinesisch, detailreiche Bilder in vielen Stilen erschaffen.

So interpretiert Tongyi Wanxiang „eine Stadtlandschaft in der Dämmerung, eine Welt, die moderne Architektur mit der Ästhetik des Anime verbindet“.
So interpretiert Tongyi Wanxiang „eine Stadtlandschaft in der Dämmerung, eine Welt, die moderne Architektur mit der Ästhetik des Anime verbindet“.
(Bild: Alibaba Cloud)

Das generative KI-Modell Tongyi Wanxiang greife auf verschiedene Technologien von Alibaba Cloud aus den Bereichen Wissensordnung, visueller KI und Natural Language Processiong (NLP) zurück. Damit seien „Zehntausende Bilder“ möglich – so jedenfalls übersetzt der Hersteller „Wanxiang“. Das Modell stehe Unternehmenskunden in China zum Betatest zur Verfügung.

Darüber hinaus präsentiert der Cloud-Anbieter „ModelScopeGPT“. Das Framework soll Anwender bei der Bewältigung komplexer und spezialisierter KI-Aufgaben in den Bereichen Bild- und Sprachverarbeitung unterstützen, indem es verschiedene KI-Modelle auf ModelScope nutzt. Die quelloffene Model-as-a-Service-Plattform (MaaS) wurde 2022 von Alibaba Cloud eingeführt und umfasse derzeit mehr als 900 KI-Modelle.

Vom Text zum Bild

Tongyi Wanxiang zufolge ist dies „ein Ring aus leuchtenden Farben vor einer herrlichen Landschaft“.
Tongyi Wanxiang zufolge ist dies „ein Ring aus leuchtenden Farben vor einer herrlichen Landschaft“.
(Bild: Alibaba Cloud)

Tongyi Wanxiang könne aus Texteingaben in Chinesisch und Englisch detaillierte Bilder in einer Reihe von Stilen – von Aquarell- und Ölmalerei bis hin zu Skizzen und 3-D-Cartoons. Darüber hinaus sei es möglich, den Inhalt eines Originalbildes beizubehalten und gleichzeitig den visuellen Stil eines anderen Bildes anzuwenden.

Durch die Optimierung des hochauflösenden Diffusionsprozesses auf der Grundlage des Signal-Rausch-Verhältnisses könne das Modell ein Gleichgewicht zwischen Kompositionsgenauigkeit und Detailschärfe herstellen und gleichzeitig seine Fähigkeit zur Erzeugung kontrastreicher, visuell beeindruckender Bilder mit sauberen Hintergründen verbessern, so Alibaba Cloud.

Für die Entwicklung von Tongyi Wanxiang habe der Hersteller das firmeneigene Modell Composer verwendet.

ModelScopeGPT für anspruchsvolle KI-Aufgaben

Mit ModelScopeGPT sei es möglich, die Fähigkeiten der auf der ModelScope-Plattform verfügbaren Large Language Models (LLMs) auszuschöpfen. Unternehmen und Entwickler könnten ModelScopeGPT kostenlos nutzen, damit auf die am besten geeigneten Modelle zugreifen und diese für die Durchführung anspruchsvoller KI-Aufgaben auf der Grundlage von Benutzeranfragen nutzen, z. B. für die Erstellung mehrsprachiger Videos.

(ID:49612038)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung