Nachdem sie den DeepSeek-Schock 2025 verdaut hat, wiegt sich die westliche Welt in trügerischer Sicherheit. Doch während US-Labs um die Spitze der Sprachlogik kämpfen, führt China ein anderes Rennen an: die Industrialisierung von Künstlicher Intelligenz (KI) – und den Sprung in die physische Welt.
Der Autor: Martin Geißler ist Partner bei der Strategieberatung Argon & Co.
(Bild: Argon & Co.)
Als das chinesische Start-up DeepSeek Anfang 2025 mit einem radikal effizienteren KI-Modell die Bühne betrat, wirkte es wie ein technologischer „Sputnik-Moment“ für die Branche. Der Mythos von OpenAIs Unantastbarkeit wurde hier erstmals erschüttert. Selbst Google-CEO Sundar Pichai war voll des Lobes für die chinesischen Entwickler. Doch heute, im Frühjahr 2026, scheint die kollektive Nervosität einer fast schon arroganten Gelassenheit gewichen zu sein: Während US-Größen wie Anthropic und OpenAI sich in einem harten Schlagabtausch um die Krone der Sprachlogik aufreiben, wiegt sich der Westen in der Sicherheit, China sei durch Chip-Sanktionen abgehängt.
Und ja: Betrachtet man aktuelle Benchmarks wie die Chatbot-Arena-Leaderboards, dann führen die neuesten US-Modelle von Anthropic und Google das Feld mit Score-Werten von über 1.500 an. Die chinesischen Wettbewerber Bytedance, Alibaba und Moonshot liegen mit 1.450 bis 1.470 ein gutes Stück zurück. Das wirkt zunächst beruhigend.
Die Wahrheit liegt abseits der Benchmarks
Doch hohe Logik-Fähigkeiten sind nicht das einzige, womit man die Qualität von Modellen messen kann. Abseits der rohen Performanz fällt eine andere Kennzahl ins Auge. Arbeits-Benchmarks wie z. B. die SWE-Scores (hier konkret der SWE-Bench Verified mit vergleichbarem Agenten-Setup), die KI-Leistung anhand der Lösungsqualität von Programmier-Tasks messen, geben neben der Ergebnisqualität auch die dabei erzeugten Kosten an.
Hier zeigt sich ein völlig anderes Bild: Die neuesten chinesischen Modelle sind hier unschlagbar effizient. MiniMax M2.5 erreicht z. B. vergleichbare Leistungen wie Top-US Modelle bei durchschnittlichen Kosten von nur sieben Cent pro SWE-Task – Gemini 3 flash landet bei 35 Cent, Claude Opus 4.6 abgeschlagen bei über 50 Cent. Bei besonders komplexen Reasoning-Aufgaben steigt der Kostenvorteil der chinesischen Modelle durch In-Context-Distillation sogar noch weiter an. Während die USA das Rennen um die rein kognitive „Frontier“ anführen, gewinnt China also das zweite Rennen: das um die Industrialisierung von KI zu vertretbaren Preisen.
Dass diese Gefahr bei Brancheninsidern wohl bekannt ist, zeigen Aussagen von KI-Leadern wie Nvidias CEO Jensen Huang und DeepMind-Gründer Demis Hassabis, die den Vorsprung auf China nur noch auf wenige Monate taxieren. Doch wie gelingt es China, ohne die Top-KI-Chips von Nvidia trotzdem so starke Modelle zu entwickeln?
Aus der Not wird eine Tugend: Von Größe zu Effizienz
Zum einen ist das ein Wahrnehmungsproblem. Aus westlicher Perspektive wird Chinas KI-Sektor oft noch als adaptiv, aber wenig innovativ unterschätzt. Doch Forschergruppen bei Firmen wie DeepSeek oder 01.AI treiben das Effizienz-Prinzip zur Perfektion. Während US-Labs versuchen, durch Brute-Force-Skalierung im Multi-Trillion-Parameter-Bereich neue Fähigkeiten zu erzwingen, und so im High-End-Segment vorn zu bleiben, fokussiert sich China statt auf Größe auf intelligente Architektur und die Mehrheit an einfacheren Anwendungsfällen.
Das Flaggschiff DeepSeek V3 mit seiner Fine-Grained-Mixture-of-Experts-Struktur ist dafür ein gutes Beispiel: Durch granulare Experten und hocheffizientes Load-Balancing werden die Betriebskosten bei vergleichbarer Leistung massiv gesenkt. Es ist die algorithmische Antwort auf den Hardware-Mangel: Wenn der Zugang zu Nvidia-Clustern begrenzt ist, muss für Innovationen der „Compute pro Token“ sinken. Deshalb trimmt China KI auf eine Kostenstruktur, die den breiten Einsatz autonomer Agenten im Massenmarkt darstellbar macht. Vielleicht wird KI-Leistung künftig gar nicht mehr in Parametern gemessen, sondern in Kosten pro autonom gelöstem Business-Task.
Unterschätzte Video-KI: Weltmodelle als „Physical OS“
Der Kern der chinesischen KI-Ambitionen ist aber die Entwicklung von Video-Generatoren wie Kling oder Seedance 2.0. Während der Westen bei Text und Logik die Nase vorne hat, dominieren chinesische Transformer die kreative Welt. Doch wer Video-Generatoren lediglich als kreative Spielzeuge abtut, übersieht, dass sie als Trainingsplatz für „World Models“ fungieren. Im Gegensatz zu rein textbasierten LLMs lernen diese Systeme physikalische Kausalitäten durch massive, multimodale Observation und entwickeln dabei ein emergentes Verständnis für Schwerkraft und räumliche Konsistenz. Und genau solche Weltmodelle sind nötig, um intelligente Roboter in der physischen Welt zu steuern.
Es ist kein Zufall, dass China massiv in diese Technologie investiert: Humanoide Roboter wie der Unitree G1 werden auf virtuellen Daten von Kling und Seedance trainiert und drängen bereits für Preise von unter 20.000 US-Dollar in industrielle Anwendungen. Dass die USA in diesem Bereich nicht völlig abgeschlagen sind, ist zuvorderst Tesla zu verdanken – denn nur dort trifft Robotik-Know-how auf echte Massenfertigungs-DNA.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Doch in Anbetracht der rasanten chinesischen Fortschritte wirkte selbst Elon Musks Optimus zuletzt blass, und bei Tempo und Breite wirken die chinesischen Hersteller derzeit im Vorteil. Und das ist äußerst relevant: Denn sobald die ersten Roboter im Einsatz sind, werden sie zu Augen und Ohren der KI. Während hochwertiger Web-Text knapp wird, generiert China dann durch seine Roboter-Flotten in den Fabriken von Shenzhen in unbegrenzter Menge proprietäre Echtwelt-Daten für das Training der Weltmodelle von morgen.
Neue Modell-Ansätze
Experten wenden gerne ein, dass gerade World Models besonders auf High-End-Chips angewiesen sein werden. Bisher galt deshalb das Dogma, dass China hier an eine unüberwindbare Grenze stoßen würde. Doch auch an dieser Annahme regt sich erster Zweifel: Diffusions-Modelle wie Seed Diffusion (Bytedance) zeigen, wie es durch Parallelisierung gelingen kann, auch ohne Blackwell-Chips atemberaubenden Inferenz-Geschwindigkeiten von > 2.000 Token pro Sekunde zu erreichen. DeepSeek soll es durch cleveres Cache Management sogar gelungen sein, 100B+-Modelle flüssig auf Consumer-Hardware zu betreiben. Sollten solche Fortschritte die Inferenz-Latenz auf Mid-Range-Chips ausreichend drücken, würde der Effekt der Exportbeschränkungen schlicht verpuffen.
Das Android-Moment: 700 Millionen Downloads
Doch damit nicht genug: Auch bei der Distribution ist China dem Westen enteilt. Während US-Player ihre mächtigsten Modelle hinter proprietären APIs verschließen und nur drastisch abgespeckte Versionen als „Open Source“ anbieten, hat Alibabas frei verfügbare Qwen-Familie mit über 700 Millionen Downloads auf Hugging Face faktisch das „Android-Moment“ der KI eingeläutet. Unzählige Start-ups weltweit bauen ihre Workflows auf chinesischen Backbones auf, weil diese zugänglich und ökonomisch attraktiv sind. Während die USA das „schlauste“ Modell in einem abgeschotteten Cloud-Tresor horten, besetzt China bereits die industrielle Infrastruktur.
Fazit: Der Einsturz des Elfenbeinturms
Der Westen hat sich in einem Elfenbeinturm aus linguistischer Brillanz eingerichtet, in der festen Überzeugung, dass derjenige gewinnt, der die komplexesten Logikrätsel löst. Doch diesen Köder hat China nicht geschluckt: Mit dem Fokus auf radikale Effizienz, Open-Weight-Distribution und die Integration von KI in die physische Welt versucht China das Spielfeld zu seinen Gunsten zu verändern, statt den Kampf zu Amerikas Konditionen zu führen.
Zwar geben OpenAI, Google und Anthropic bei LLMs weiterhin den Takt an. Doch China baut bereits das Nervensystem für den Eintritt von KI in die physische Welt. Gut möglich, dass der Westen dann am Ende zwar die besten Lyriker der KI-Ära hervorgebracht hat – China aber die Welt regiert, in der diese KIs tatsächlich arbeiten.