Anthropic erweitert KI-Entwicklungstools mit Claude 3.7 Sonnet & Claude Code

Hybrides KI-Modell Claude 3.7 Sonnet und Dev-Tool Claude Code Neue Einsatzszenarien für Claude

05.05.2025 Von Thomas Joos 4 min Lesedauer

Mit Claude 3.7 Sonnet und dem neuen Tool Claude Code erweitert Anthropic das Spektrum KI-gestützter Entwicklungswerkzeuge. Die Kombination aus Sprachmodell mit Hybrid-Logik und lokalem CLI-Agenten zielt auf praxisnahe Automatisierung und präzise Unterstützung bei komplexen Programmieraufgaben.

Anthropic Claude 3.7 Sonnet und Anthropic Claude Code bringen vor allem für Entwickler zahlreiche Vorteile mit sich.(Bild: T. Joos) — Anthropic Claude 3.7 Sonnet und Anthropic Claude Code bringen vor allem für Entwickler zahlreiche Vorteile mit sich.
(Bild: T. Joos)

Claude 3.7 Sonnet markiert einen neuen technischen Meilenstein unter den Large Language Models (LLMs). Anthropic positioniert das Modell mit einem hybriden Denkansatz, der zwei Betriebsmodi vereint: eine standardisierte, reaktive Antwortausgabe und einen erweiterten Denkmodus, bei dem die KI mehr Rechenzeit für komplexe Aufgaben nutzt. Anders als bei vergleichbaren Modellen bleibt Claude 3.7 dabei konsistent, es wechselt nicht zwischen verschiedenen Modellinstanzen, sondern moduliert intern das Antwortverhalten durch „Extended Thinking“.

Dieser Mechanismus soll insbesondere bei Aufgaben mit höherem logischen Anspruch präzisere Ergebnisse liefern, wie etwa bei der Programmierung, in der Mathematik oder bei wissenschaftlichen Analysen. Entwickler erhalten über die API die Möglichkeit, ein sogenanntes „Thinking Budget“ festzulegen, das definiert, wie tiefgreifend die KI ein Problem durchdenken darf. Laut Anthropic ist das nicht nur ein Performance-Feature, sondern ein Beitrag zu mehr Transparenz, da die gedanklichen Zwischenschritte der KI vollständig sichtbar bleiben.

Claude Code: Agentische Unterstützung im Terminal

Parallel zum Modell wurde „Claude Code“ vorgestellt, eine neue, agentenbasierte Entwicklungsumgebung, die direkt im Terminal betrieben wird. Das Tool steht derzeit im Research Preview zur Verfügung und ist für Entwickler gedacht, die mit lokalen Repositories arbeiten. Claude Code kann bestehende Projekte analysieren, Quelltexte in mehreren Dateien anpassen und sogar Build- oder Testprozesse automatisiert ausführen. Dabei wird Kontext aus allen betroffenen Dateien gezogen und berücksichtigt.

Zu den Funktionen gehören die Bearbeitung kompletter Projektstrukturen, das Umsetzen von UI-Anpassungen, das Einfügen von neuen Komponenten oder die Umstellung technischer Architekturen, etwa von Docker-basierten auf Firecracker-MicroVMs. Firecracker gilt als besonders leichtgewichtiges Virtualisierungskonzept, das für hochskalierbare Umgebungen entwickelt wurde. Claude generiert dazu eigenständig Konfigurationsdateien, sorgt für passende Paketabhängigkeiten und nimmt sogar schrittweise Optimierungen am ausgegebenen Code vor.

Performance und Kontextumfang im Vergleich

Im Vergleich zu Claude 3.5 zeigt die neue Version deutlich bessere Resultate bei standardisierten Benchmarks. Bei Aufgaben mit langem Kontextverlauf profitiert Claude 3.7 zudem von einem erweiterten Kontextfenster von bis zu 200.000 Tokens. Das ermöglicht es, große Codebasen oder umfangreiche Dokumente in einem Durchlauf zu analysieren. Die Ausgabeleistung liegt laut internen Tests bei über 110.000 Zeichen pro Antwort. Dabei bleibt das Modell konsistent in der Ausführung, ohne künstliche Begrenzung, eine Schwäche, die bei Konkurrenzmodellen immer wieder für Einschränkungen sorgt.

Claude kann komplette Applikationen aus einem einzigen Prompt generieren, inklusive Backend, Frontend, Authentifizierung und Datenbankintegration. Änderungen an bestehenden Anwendungen lassen sich ebenfalls promptbasiert durchführen, inklusive visueller Verbesserungen, etwa an Schriftarten, Farbschemata oder Layouts.

Anwendungsfälle: Von UI-Generierung bis Infrastrukturmigration

Claude 3.7 zeigt Stärken in der UI-Erstellung mit modernen Frameworks wie React und Tailwind CSS. Es lassen sich komplette Dashboards mit ansprechender Gestaltung, responsivem Verhalten und Animationslogik generieren. Auch Anpassungen an bestehenden Designs sind möglich, allerdings mit Einschränkungen. Manche Ausgabeformate, insbesondere bei komplexen Farbanforderungen oder Kontrastverhältnissen, entsprechen nicht immer vollständig gängigen UX-Prinzipien. Hier ist eine manuelle Nachjustierung durch Entwickler weiterhin notwendig.

GPT-4.5 ist das neue Flaggschiff-Modell von OpenAI. (Bild: T. Joos)

Technisch ambitionierter ist die Umstellung bestehender Architekturen von Docker auf Firecracker. Claude übernimmt dabei nicht nur die Erstellung neuer Ausführungslogik, sondern integriert auch Sockelkommunikation über vsock sowie passende Host-Konfigurationen für Alpine Linux. Selbst bei auftretenden Fehlern liefert das Modell Korrekturen, führt die Tests erneut durch und überarbeitet den Code iterativ. Dabei entstehen oft mehrere hundert Zeilen Code in einer einzigen Sitzung.

Kritikpunkte: Kostenstruktur, Autovervollständigung und IDE-Integration

Trotz der hohen Leistungsfähigkeit von Claude Code zeigen sich im Arbeitsalltag einige Einschränkungen. Anders als bei integrierten Lösungen wie Cursor oder dem VS Code Fork fehlen Claude Code Funktionen wie Autovervollständigung oder kontextsensitive Vorschläge. Die Bedienung ist rein promptbasiert, was für viele Entwickler weniger effizient ist als klassische IDE-Workflows.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Geschäftliche E-Mail

Bitte geben Sie eine gültige E-Mailadresse ein.

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Stand: 08.12.2025

Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.

Einwilligung in die Verwendung von Daten zu Werbezwecken

Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.

Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.

Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.

Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.

Recht auf Widerruf

Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.

Auch die Kostenfrage ist nicht trivial. Claude Code verwendet Tokens auf Basis der Claude-API, wodurch bei umfangreichen Änderungen schnell mehrere Dollar pro Interaktion entstehen können. In Tests entstanden für komplexe Umstellungen Kosten im Bereich von drei bis fünf US-Dollar pro Bearbeitung. Für häufige Iterationen ist das Preis-Leistungs-Verhältnis damit nicht immer ideal, vor allem im Vergleich zu Open-Source-basierten Alternativen oder bereits optimierten IDE-Integrationen.

Benchmark-Vergleiche und Sprachdiversität

Im Vergleich mit führenden Modellen wie GPT-4o, Gemini 1.5 oder DeepSeek R1 liegt Claude 3.7 insbesondere bei Software-Engineering-Benchmarks vorne. Bei Testverfahren wie MMLU oder GPQA zeigte Claude nicht nur im Denken-Modus, sondern auch im Basismodus starke Leistungen. Das nicht-„denkende“ Modell liegt in einigen Tests nur knapp hinter dedizierten Top-Modellen.

Besonders auffällig ist die überdurchschnittliche Performance in Mehrsprachigkeitstests. Claude 3.7 übertrifft hier Modelle wie o3 Mini High und zeigt stabile Resultate auch bei deutschsprachigen Eingaben. In Benchmarks zur visuellen Analyse schneidet Claude ebenfalls solide ab, wenngleich hier Gemini 2.0 und Grok derzeit führend sind.

Erweiterte Funktionen und Systemintegration

Claude 3.7 unterstützt eine erweiterte Computersteuerung („Computer Use“), bei der virtuelle Mausbewegungen und Tasteneingaben möglich sind. In der Praxis ist diese Funktion jedoch bisher stark eingeschränkt und erfordert zusätzliche Programmierarbeit über die API. Eine native Integration in Desktop-Umgebungen oder Browser steht bislang aus.

Die Verwaltung von Projekten und Prompts wurde verbessert. Claude unterstützt projektbasierte Organisation, Datei-Upload sowie eine visuelle Darstellung sogenannter Artefakte, etwa interaktive UI-Komponenten oder Ergebnisgrafiken. So können Nutzer nicht nur Code generieren lassen, sondern auch direkt im Browser einfache Webanwendungen testen und modifizieren.

Sicherheitsvorgaben und Grenzen der Offenheit

Claude bleibt wie viele aktuelle Modelle auf bestimmte Inhalte beschränkt. Politisch oder ethisch sensible Themen, Gewaltbeschreibungen, religiöse Kritik, toxische Sprache oder Informationen zu kritischen Substanzen werden systematisch gefiltert. Für Anwendungen wie Redaktionsassistenz, Fiktion oder kreative Texte ist dies eine Einschränkung, die Entwickler im Hinterkopf behalten müssen. Erlaubt bleibt hingegen die Simulation sicherheitsrelevanter Tests im Penetration-Testing-Kontext.

Anthropics Claude-3-Modelle laufen auch im Framework Amazon Bedrock. (Bild: Anthropic)

Auch bei komplexen Anwendungsfällen im Sicherheitsbereich, etwa dem Umgang mit sensiblen Systembefehlen oder Netzwerkoperationen, zeigt Claude regulatorische Schranken. Die Entwickler von Anthropic verweisen in Whitepapers auf die bewusste Begrenzung bestimmter Antworten. Gleichzeitig bleiben Diagnosefähigkeiten, Logging-Mechanismen und Korrekturvorschläge im technischen Kontext auf hohem Niveau.

(ID:50388843)