Kommentar von Kiran Matty, Couchbase Context Engineering entscheidet über den Erfolg von KI-Agenten

Von Kiran Matty 4 min Lesedauer

Anbieter zum Thema

Sobald KI-Agenten nicht nur Texte generieren, sondern Entscheidungen treffen, Tools aufrufen oder Prozesse anstoßen, entscheidet die Qualität der bereitgestellten Informationen über ihren Erfolg. Wie man hier strategisch vorgeht, damit Agenten mit dem bestmöglichen Informationsmix arbeiten, erklärt das Konzept des Context Engineering.

Der Autor: Kiran Matty ist Lead Product Manager AI/ML bei Couchbase(Bild:  Couchbase)
Der Autor: Kiran Matty ist Lead Product Manager AI/ML bei Couchbase
(Bild: Couchbase)

Unternehmen verfügen über große Mengen strukturierter und unstrukturierter Daten: Tickets, E-Mails, Logfiles, Dokumente, Datenbankeinträge. Vieles davon wäre für einen Agenten potenziell relevant. Naheliegend wäre es dementsprechend, möglichst viele dieser Informationen direkt als Kontext an ein Sprachmodell zu übergeben. Genau das funktioniert jedoch nicht.

Zum einen sind Context Windows auch bei modernen Modellen endlich. Selbst sehr große Token-Limits sind kein Ersatz für Selektion, denn jeder zusätzliche Token verursacht Kosten, erhöht die Latenz und kann die Modellleistung verschlechtern. Zum anderen sind Unternehmensdaten häufig nicht kuratiert. Sie enthalten Wiederholungen, Nebenstränge, interne Diskussionen, alte Versionen, Ausnahmen und Widersprüche. Wird dieser Sumpf ungefiltert übergeben, verliert das Modell schnell den Kern der Aufgabe und die relevanten Daten aus dem Blick.

Auch das andere Extrem führt zu Problemen. Erhält ein Agent zu wenig Kontext, beginnt er zu halluzinieren oder trifft Annahmen, die fachlich nicht gedeckt sind. Die Herausforderung besteht also darin, genau den Kontext bereitzustellen, der für die jeweilige Aufgabe notwendig ist. Context Engineering beschreibt die Arbeit, das beherrschbar zu machen.

Was Context Engineering umfasst

1. Tool-Auswahl: KI-Agenten arbeiten selten isoliert. Sie rufen APIs auf, greifen auf Datenbanken zu oder lösen Aktionen in externen Systemen aus. Wird einem Agenten ein vollständiger Werkzeugkasten präsentiert, steigt die Wahrscheinlichkeit falscher oder ineffizienter Tool-Aufrufe.

Effektives Context Engineering sorgt dafür, dass ein Agent nur diejenigen Tools kennt, die für die aktuelle Anfrage relevant sind – inklusive klarer Beschreibungen und stabiler Schnittstellen.

2. Memory: Agenten arbeiten selten in einem einzigen Schritt. Sie führen Dialoge, lösen Aufgaben in mehreren Iterationen und knüpfen Entscheidungen an vorherige Ergebnisse. Ohne Gedächtnis entsteht ein System, das zwar eloquent wirkt, aber bei jeder Rückfrage wieder bei Null beginnt.

Damit Agenten konsistent agieren können, müssen sie Informationen also speichern. Es hilft, unterschiedliche Arten von Gedächtnis zu unterscheiden, weil sie in Anwendungen unterschiedliche Funktionen erfüllen.

Profile Memory umfasst stabile Informationen über Nutzer oder Systeme, etwa Rollen, Berechtigungen, bevorzugte Sprache oder Zuständigkeiten. Semantic Memory speichert Fakten, beispielsweise Produktwissen oder definierte Unternehmensbegriffe.

Episodic Memory hält konkrete Ereignisse fest: Was ist in einem früheren Fall passiert, welche Entscheidung wurde getroffen, welche Ausnahme wurde genehmigt.

Conversational Memory fasst den Verlauf eines Dialogs zusammen, um Wiederholungen zu vermeiden und Anschlussfähigkeit herzustellen. Procedural Memory beschreibt Abläufe: Welche Schritte sind in einem Prozess üblich, welche Reihenfolge ist vorgesehen, welche Regeln gelten.

In Multi-Agenten-Setups kommt ein gemeinsamer Working Memory hinzu, über das Agenten Zwischenergebnisse austauschen, damit nicht jeder dieselbe Recherche durchführt.

Eine zentrale Herausforderung ist das sogenannte Memory Decay. Würde ein Agent alle Informationen dauerhaft behalten, wäre das Context Window schnell überfüllt. Gleichzeitig dürfen relevante Informationen nicht zu früh verloren gehen. Nutzerpräferenzen können über Monate relevant sein, während einzelne Gesprächsdetails nach einer Session an Bedeutung verlieren. Context Engineering muss daher festlegen, welche Informationen mit welcher Halbwertszeit gespeichert werden. Die richtige Balance zu finden, bleibt eine der anspruchsvollsten Aufgaben.

3. Prompt Engineering: Prompts definieren Rolle, Verhalten und Grenzen eines Agenten. Kleine Änderungen können große Auswirkungen haben. Deshalb sollten Prompts versioniert, getestet und gezielt ausgewählt werden, statt sie statisch in Code zu verankern.

4. Retrieval: Statischer Kontext reicht in dynamischen Umgebungen nicht aus. Relevante Informationen müssen in vielen Fällen live abgerufen werden. Retrieval-Augmented Generation (RAG) ist hierbei der gängigste Ansatz. Inhalte werden über Vektorsuche oder strukturierte Abfragen selektiert und in den Prompt integriert. Die Auswahl an konsistenten Quellen ist hier der entscheidende Erfolgsfaktor.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Architektur statt Bastellösung

In vielen Projekten wachsen diese Context-Lösungen nebenbei. Ein paar Prompts hier, ein Vector Store dort, ein selbstgebautes Memory-System an anderer Stelle. Das funktioniert für Prototypen, skaliert aber schlecht.

Mit Context Engineering klappt es langfristig besser. So sammelt der Agent zunächst kontextrelevante Informationen wie passende Tools aus einem Katalog, relevante Dokumente aus einem Vector Store, verdichtete Gesprächshistorien aus Memory-Systemen sowie strukturierte Daten aus operativen Datenbanken. Erst dieser konsolidierte Kontext wird an das Sprachmodell übergeben.

Innerhalb eines Agent-Frameworks läuft anschließend ein Reasoning Loop ab, bei dem das Modell entscheidet, welche Tools aufzurufen sind und ob weitere Agenten eingebunden werden müssen. Die Ergebnisse fließen wiederum in den Memory zurück.

Sobald mehrere Agenten oder mehrere Interaktionen beteiligt sind, können widersprüchliche Informationen vorkommen. Context Engineering muss daher auch Regeln zur Konfliktauflösung vorsehen. Zeitstempel, Quellenangaben und Agentidentitäten helfen dem Modell, Informationen einzuordnen.

Fazit

Context Engineering ist ein strategischer Ansatz für den produktiven Einsatz von KI-Agenten. Wer sich allein auf größere Modelle oder längere Context Windows verlässt, wird auf Dauer negative Konsequenzen daraus ziehen.

Erst die gezielte Auswahl, Aufbereitung und Verwaltung von Kontext macht Agenten nachvollziehbar, kontrollierbar und wirtschaftlich betreibbar. Für Unternehmen gilt deshalb: weniger basteln, mehr Architekturarbeit.

Artikelfiles und Artikellinks

(ID:50715484)