Grok 3 Was die KI von xAI technisch wirklich kann

Von Thomas Joos 4 min Lesedauer

Anbieter zum Thema

Grok 3 steht derzeit kostenfrei für Nutzer von X zur Verfügung, allerdings nur vorübergehend. Elon Musk kündigt bereits an, dass der Zugriff später auf zahlende Abonnenten beschränkt werde. Schon jetzt unterscheidet xAI zwischen freien Nutzern, Premium+ und der neuen Stufe „SuperGrok“. Wer nicht zahlt, darf alle zwei Stunden zehn Textanfragen und zehn Bildgenerierungen absenden. Die Bildanalyse ist auf drei Durchgänge pro Tag beschränkt. Eine erweiterte Nutzung erfordert mindestens den Premium+-Zugang.

Grok 3 lässt sich kostenlos nutzen, aber richtig effektiv wird die Verwendung nur über ein bezahltes Abonnement.(Bild:  T. Joos)
Grok 3 lässt sich kostenlos nutzen, aber richtig effektiv wird die Verwendung nur über ein bezahltes Abonnement.
(Bild: T. Joos)

Das Modell, das Grok 3 nutzt, wurde auf einem Colossus-Rechenzentrum mit 200.000 Nvidia H100-GPUs trainiert, 122 Tage am Stück. Damit zählt Grok 3 zu den aktuell rechenintensivsten generativen Modellen. Die Architektur zielt nicht auf maximale Sprachästhetik, sondern auf sogenannte „truth-seeking“-Antworten. Entsprechend reagiert Grok 3 weniger ausweichend auf heikle oder umstrittene Fragen, eine bewusste Abgrenzung gegenüber GPT-4.

Unterschiede bei Prompting und Steuerung

Wer Grok 3 effizient nutzen will, muss genau arbeiten. Das Modell setzt stark auf Klartext statt formalisierter Codesprache. Prompts folgen einem einfachen Prinzip: Format, Stil und Einschränkungen definieren. Grok reagiert auf Tonalitätsvorgaben, erwartet eine exakte Formatierung (zum Beispiel stichpunktartig oder als Gliederung) und akzeptiert Restriktionen wie Wortanzahl oder Inhaltsverbote. In der Praxis funktionieren viele Prompting-Tricks aus ChatGPT, Claude oder Gemini auch hier, sofern man Grok konsequent führt.

Think-Button, DeepSearch und iterative Analyse

Anders als GPT-4 oder Claude 3 aktiviert Grok 3 seine erweiterte Denkfunktion über einen Button namens „Think“. Damit wird die interne Reasoning-Funktion zugeschaltet, nützlich bei schrittweisem Vorgehen oder logischen Ketten. Für Recherchen lassen sich zwei Suchmodi aktivieren: „DeepSearch“ liefert zügige Ergebnisse mit Webbezug, „DeeperSearch“ geht tiefer, dauert aber spürbar länger. Beide nutzen klare Promptregeln, erwarten präzise Fragestellungen und liefern strukturierte Antworten, inklusive Quellensortierung, Kategorisierung und Textvergleich.

Bildgenerierung und der eingeschränkte Canvas-Modus

Grok 3 bietet rudimentäre Bildfunktionen, aber kein eigenständiges visuelles Interface wie Midjourney oder DALL-E 3. Der Bildeditor versteckt sich im Canvas-Modus, der manuell aktiviert werden muss. Einmal geöffnet, bietet er einfache Stiländerungen, Objektauswahl und Textergänzungen. Prompting bleibt auch hier rein textbasiert. Für komplexe Bildideen oder Markendesign eignet sich Grok nur bedingt, die Kontrolle über Komposition, Licht, Stil oder Format ist stark eingeschränkt.

Grok 3 kombiniert Text-, Bild- und Dateiverarbeitung in einer Oberfläche, verzichtet aber vollständig auf interaktive Bedienungshilfen. Die Steuerung aller Funktionen erfolgt ausschließlich über Prompts. Es gibt kein visuelles Interface zur Auswahl von Dateibereichen, kein Kontextmenü für Bilder und keine vordefinierten Analyseoptionen. Auch die Bildbearbeitung bleibt textgesteuert, ohne interaktive Vorschau. Besonders bei der Multimodalität zeigt sich die technische Rohheit des Modells: Grok reagiert korrekt, wenn die Anforderungen präzise benannt sind, versagt jedoch bei undeutlichen Aufträgen oder mehrdeutigen Formulierungen. Die Ausgabequalität bei kombinierten Aufgaben, etwa Textinterpretation mit anschließendem Bildvergleich, hängt stark vom schrittweisen Aufbau der Prompts ab.

Dateiuploads, Vergleich und Dokumentenanalyse

Grok akzeptiert Dateiuploads über Google Drive oder OneDrive. PDFs und Tabellen können analysiert, verglichen oder strukturiert zusammengefasst werden. Die Stärke liegt in der Fähigkeit, mehrere Dateien gegeneinander auszuwerten, Veränderungen zu erkennen und auf Wunsch in Reports umzuwandeln. Die Ausgabe kann in Listen, Gliederungen oder Fließtext erfolgen. Für wiederholbare Analysen empfiehlt sich die Aufteilung komplexer Anforderungen in logische Einzelschritte, Grok unterstützt diesen iterativen Workflow.

Personas, Workspaces und Custom Instructions

Die Arbeitsweise lässt sich granular steuern. Grok nutzt sogenannte Personas, also vordefinierte Rollen mit begrenztem Fachwissen und angepasstem Sprachstil. Diese lassen sich jederzeit umschalten, ohne dass ein neuer Chat gestartet werden muss. Workspaces funktionieren wie Themenräume mit eigenen Kontexteinstellungen und Dateibereichen. Jeder Workspace speichert individuelle Anweisungen für Format, Stil oder Tonalität.

Im Gegensatz zu vielen US-Modellen lässt Grok 3 inhaltlich deutlich mehr zu. Tests zeigen, dass sich politische Inhalte, kontroverse Meinungen und sicherheitsrelevante Themen leichter abfragen lassen als bei GPT-4 oder Claude. Zwar sind Schutzfunktionen vorhanden, sie greifen jedoch unregelmäßig. Einige Inhalte werden bei direkter Anfrage blockiert, lassen sich jedoch durch Umformulierungen oder gestaffelte Prompts rekonstruieren. Diese Lücken deuten auf ein weniger restriktiv konfiguriertes Content-Filtering hin. Welche Regeln greifen und in welchen Fällen, bleibt für Nutzer nicht nachvollziehbar, Grok liefert keine Hinweise auf die Ursache einer Ablehnung. Das erschwert die verlässliche Planung sicherheitskritischer oder regulatorisch sensibler Anwendungen.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Leistung und Grenzen

In Benchmarks liefert Grok 3 solide Ergebnisse, erreicht aber nicht durchgängig die Präzision von GPT-4 Turbo oder Claude 3 oder 4. Auffällig sind stilistische Schwächen bei längeren Texten, vereinzelte Inkonsistenzen in logischen Ketten sowie eine erhöhte Fehleranfälligkeit bei komplexem Code. In der Praxis hängt die Qualität stark von der Promptstruktur ab. Ohne klare Vorgaben neigt Grok zu Wiederholungen oder inhaltlicher Vagheit.

Grok 3 passt seine Ausgabe stark an den Stil vorgegebener Beispiele an und zeigt eine hohe Sensitivität gegenüber Promptqualität. Das Modell reagiert deutlich auf Tonalität, Strukturvorgaben oder stilistische Vorgaben im Text. Gleichzeitig treten bei physikalischen oder mathematisch präzisen Aufgaben instabile Ergebnisse auf. In Tests mit physikalischen Simulationen und Code-Ausgaben lieferte Grok 3 teils falsche Reaktionen oder unvollständige Abläufe. Auch beim Schreiben interaktiver Spiele oder bei der Berechnung von Kollisionen offenbarten sich Lücken im Modellverständnis. Diese Schwächen treten vor allem dann zutage, wenn Prompts zu offen oder zu abstrakt formuliert sind. Grok bevorzugt konkrete Aufgabenstellungen mit klarer Erwartungshaltung.

Fazit: Technisch vielseitig, aber nicht überlegen

Grok 3 punktet mit Geschwindigkeit, einem aufgeräumten Interface und einem offenen Zugriff auf bisher gesperrte Themenbereiche. Der strukturelle Aufbau, DeepSearch, Think, Canvas, Workspaces, wirkt modular, aber noch nicht vollendet. Als temporär kostenlose Option liefert Grok 3 ein beachtliches Leistungsspektrum. Wer jedoch konsistente Ergebnisse, stabile Textausgaben oder leistungsfähige Bildbearbeitung sucht, stößt bald an Grenzen, vor allem ohne Bezahlzugang.

Artikelfiles und Artikellinks

(ID:50465023)