OpenAIs KI-Offensive Rollout für Sora und GPT-4.5

Von Berk Kutsal 2 min Lesedauer

Anbieter zum Thema

Mit Sora präsentiert OpenAI sein leistungsfähiges KI-gestütztes Video-Tool nun auch europäischen Nutzern, um realistische Videos per Texteingabe zu generieren. Gleichzeitig wurde mit GPT-4.5 eine optimierte Version des Sprachmodells vorgestellt, die durch eine erweiterte Wissensbasis und effizientere Verarbeitung überzeugen soll. Beide Technologien stehen ab sofort Pro-Nutzern zur Verfügung und werden sukzessive weiter ausgerollt.

OpenAI stellt neues Video-KI-Modell Sora und neues Sprachmodell GPT-4.5 vor. (Bild:  Kenny - stock.adobe.com)
OpenAI stellt neues Video-KI-Modell Sora und neues Sprachmodell GPT-4.5 vor.
(Bild: Kenny - stock.adobe.com)

Mit Sora bringt OpenAI sein generatives KI-Modell für die Videoerstellung nun auch auf den europäischen Markt. Das Tool ermöglicht es, Videos allein auf Basis von Texteingaben oder durch die Kombination von bestehenden Bild- und Videomaterialien zu generieren.

Sora nutzt fortschrittliche Deep-Learning-Techniken, um visuelle Inhalte aus Textbeschreibungen zu erzeugen. Dabei analysiert das Modell semantische Zusammenhänge und generiert kohärente Szenen mit realistischen Bewegungsabläufen, Lichteffekten und Perspektiven. OpenAI beschreibt das Tool als „Storytelling-Tool für eine breitere kreative Gemeinschaft“. Nutzer können einzelne Elemente innerhalb eines Videos anpassen, entfernen oder erweitern, um Szenen nahtlos zu bearbeiten oder zu optimieren.

Die folgenden Features stehen in Sora zur Videoerstellung und -bearbeitung zur Verfügung:

  • Remix: Ersetzen, entfernen oder neu interpretieren von Elementen in Videos
  • Re-Cut: Die besten Frames identifizieren und in beide Richtungen erweitern, um eine Szene zu vervollständigen
  • Storyboard: Einzigartige Sequenzen von Videos auf einer persönlichen Timeline organisieren und bearbeiten
  • Loop: Videos zuschneiden und nahtlose Endloswiederholungen erstellen
  • Blend: Zwei Videos nahtlos in einem Clip kombinieren
  • Presets: Stile erstellen und teilen, die die eigene Vorstellungskraft einfangen – z. B. Film Noir, Karton und Papierkunst

GPT-4.5: Sprachmodell mit verbesserter Skalierung

Neben Sora hat OpenAI mit GPT-4.5 eine neue Version seines Sprachmodells vorgestellt. Das Modell setzt auf eine effizientere Skalierung des unüberwachten Lernens und wurde auf Microsofts Azure AI Supercomputern trainiert. Laut OpenAI bietet das Modell eine „breitere Wissensbasis, eine verbesserte Fähigkeit, der Absicht des Users zu folgen, sowie eine optimierte Zusammenarbeit und Wissen“. Erste Tests zeigen, dass sich die Interaktion mit GPT-4.5 wohl natürlicher anfühlt und weniger Halluzinationen auftreten. Durch feinere Sprachführung und besseres Verständnis komplexer Sachverhalte soll das Modell insbesondere für professionelle Anwendungen in den Bereichen Recherche, Programmierung und Content-Erstellung nützlich sein.

Die Entwicklung fokussierte sich auf die Skalierung bestehender Mechanismen, nicht auf die Integration vollkommen neuer Funktionen. Dadurch unterscheidet sich das Modell in seiner Kernarchitektur nicht grundlegend von GPT-4. Dennoch biete es Vorteile in der Modellkontrolle und präziseren Textgenerierung.

Im technischen Hintergrund kommen bewährte Transformer-Architekturen zum Einsatz, optimiert durch verfeinerte Attention-Mechanismen und effizientere Parameterverteilung. Das Ziel sei es, eine gleichbleibend hohe Antwortqualität über verschiedene Anwendungsszenarien hinweg zu gewährleisten. Durch die Skalierung des unüberwachten Lernens verbessere GPT-4.5 seine Fähigkeit, ohne Reasoning Muster und Zusammenhänge zu erkennen und kreative Erkenntnisse zu generieren.

Auswirkungen auf die KI-Landschaft

Sora und GPT-4.5 zeigen, dass OpenAI seine Technologien weiter diversifiziert. Während GPT-4.5 die klassische Text-KI verbessert, erweitert Sora das Portfolio um leistungsfähige Video-Generierung. Dies könnte den Markt für visuelle Inhalte nachhaltig verändern, während GPT-4.5 weiterhin als treibende Kraft in der KI-gestützten Sprachverarbeitung fungiert.

Gleichzeitig bleiben Herausforderungen bestehen: Während sich bei Sprach-KI nach wie vor Fragen zur Genauigkeit und Manipulationsanfälligkeit stellen, wirft Sora neue ethische Diskussionen um Deepfake-Technologien und die Authentizität digitaler Inhalte auf. Kritiker befürchten, dass solche Technologien weiter missbraucht werden könnten, was die Notwendigkeit von Transparenz und Kontrollmechanismen unterstreicht. OpenAI betont jedoch, dass Sicherheitsmechanismen zur Erkennung synthetischer Inhalte in beide Modelle integriert wurden.

(ID:50339107)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung