Sobald KI-Agenten nicht nur Texte generieren, sondern Entscheidungen treffen, Tools aufrufen oder Prozesse anstoßen, entscheidet die Qualität der bereitgestellten Informationen über ihren Erfolg. Wie man hier strategisch vorgeht, damit Agenten mit dem bestmöglichen Informationsmix arbeiten, erklärt das Konzept des Context Engineering.
Der Autor: Kiran Matty ist Lead Product Manager AI/ML bei Couchbase
(Bild: Couchbase)
Unternehmen verfügen über große Mengen strukturierter und unstrukturierter Daten: Tickets, E-Mails, Logfiles, Dokumente, Datenbankeinträge. Vieles davon wäre für einen Agenten potenziell relevant. Naheliegend wäre es dementsprechend, möglichst viele dieser Informationen direkt als Kontext an ein Sprachmodell zu übergeben. Genau das funktioniert jedoch nicht.
Zum einen sind Context Windows auch bei modernen Modellen endlich. Selbst sehr große Token-Limits sind kein Ersatz für Selektion, denn jeder zusätzliche Token verursacht Kosten, erhöht die Latenz und kann die Modellleistung verschlechtern. Zum anderen sind Unternehmensdaten häufig nicht kuratiert. Sie enthalten Wiederholungen, Nebenstränge, interne Diskussionen, alte Versionen, Ausnahmen und Widersprüche. Wird dieser Sumpf ungefiltert übergeben, verliert das Modell schnell den Kern der Aufgabe und die relevanten Daten aus dem Blick.
Auch das andere Extrem führt zu Problemen. Erhält ein Agent zu wenig Kontext, beginnt er zu halluzinieren oder trifft Annahmen, die fachlich nicht gedeckt sind. Die Herausforderung besteht also darin, genau den Kontext bereitzustellen, der für die jeweilige Aufgabe notwendig ist. Context Engineering beschreibt die Arbeit, das beherrschbar zu machen.
Was Context Engineering umfasst
1. Tool-Auswahl: KI-Agenten arbeiten selten isoliert. Sie rufen APIs auf, greifen auf Datenbanken zu oder lösen Aktionen in externen Systemen aus. Wird einem Agenten ein vollständiger Werkzeugkasten präsentiert, steigt die Wahrscheinlichkeit falscher oder ineffizienter Tool-Aufrufe.
Effektives Context Engineering sorgt dafür, dass ein Agent nur diejenigen Tools kennt, die für die aktuelle Anfrage relevant sind – inklusive klarer Beschreibungen und stabiler Schnittstellen.
2. Memory: Agenten arbeiten selten in einem einzigen Schritt. Sie führen Dialoge, lösen Aufgaben in mehreren Iterationen und knüpfen Entscheidungen an vorherige Ergebnisse. Ohne Gedächtnis entsteht ein System, das zwar eloquent wirkt, aber bei jeder Rückfrage wieder bei Null beginnt.
Damit Agenten konsistent agieren können, müssen sie Informationen also speichern. Es hilft, unterschiedliche Arten von Gedächtnis zu unterscheiden, weil sie in Anwendungen unterschiedliche Funktionen erfüllen.
Profile Memory umfasst stabile Informationen über Nutzer oder Systeme, etwa Rollen, Berechtigungen, bevorzugte Sprache oder Zuständigkeiten. Semantic Memory speichert Fakten, beispielsweise Produktwissen oder definierte Unternehmensbegriffe.
Episodic Memory hält konkrete Ereignisse fest: Was ist in einem früheren Fall passiert, welche Entscheidung wurde getroffen, welche Ausnahme wurde genehmigt.
Conversational Memory fasst den Verlauf eines Dialogs zusammen, um Wiederholungen zu vermeiden und Anschlussfähigkeit herzustellen. Procedural Memory beschreibt Abläufe: Welche Schritte sind in einem Prozess üblich, welche Reihenfolge ist vorgesehen, welche Regeln gelten.
In Multi-Agenten-Setups kommt ein gemeinsamer Working Memory hinzu, über das Agenten Zwischenergebnisse austauschen, damit nicht jeder dieselbe Recherche durchführt.
Eine zentrale Herausforderung ist das sogenannte Memory Decay. Würde ein Agent alle Informationen dauerhaft behalten, wäre das Context Window schnell überfüllt. Gleichzeitig dürfen relevante Informationen nicht zu früh verloren gehen. Nutzerpräferenzen können über Monate relevant sein, während einzelne Gesprächsdetails nach einer Session an Bedeutung verlieren. Context Engineering muss daher festlegen, welche Informationen mit welcher Halbwertszeit gespeichert werden. Die richtige Balance zu finden, bleibt eine der anspruchsvollsten Aufgaben.
3. Prompt Engineering: Prompts definieren Rolle, Verhalten und Grenzen eines Agenten. Kleine Änderungen können große Auswirkungen haben. Deshalb sollten Prompts versioniert, getestet und gezielt ausgewählt werden, statt sie statisch in Code zu verankern.
4. Retrieval: Statischer Kontext reicht in dynamischen Umgebungen nicht aus. Relevante Informationen müssen in vielen Fällen live abgerufen werden. Retrieval-Augmented Generation (RAG) ist hierbei der gängigste Ansatz. Inhalte werden über Vektorsuche oder strukturierte Abfragen selektiert und in den Prompt integriert. Die Auswahl an konsistenten Quellen ist hier der entscheidende Erfolgsfaktor.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Architektur statt Bastellösung
In vielen Projekten wachsen diese Context-Lösungen nebenbei. Ein paar Prompts hier, ein Vector Store dort, ein selbstgebautes Memory-System an anderer Stelle. Das funktioniert für Prototypen, skaliert aber schlecht.
Mit Context Engineering klappt es langfristig besser. So sammelt der Agent zunächst kontextrelevante Informationen wie passende Tools aus einem Katalog, relevante Dokumente aus einem Vector Store, verdichtete Gesprächshistorien aus Memory-Systemen sowie strukturierte Daten aus operativen Datenbanken. Erst dieser konsolidierte Kontext wird an das Sprachmodell übergeben.
Innerhalb eines Agent-Frameworks läuft anschließend ein Reasoning Loop ab, bei dem das Modell entscheidet, welche Tools aufzurufen sind und ob weitere Agenten eingebunden werden müssen. Die Ergebnisse fließen wiederum in den Memory zurück.
Sobald mehrere Agenten oder mehrere Interaktionen beteiligt sind, können widersprüchliche Informationen vorkommen. Context Engineering muss daher auch Regeln zur Konfliktauflösung vorsehen. Zeitstempel, Quellenangaben und Agentidentitäten helfen dem Modell, Informationen einzuordnen.
Fazit
Context Engineering ist ein strategischer Ansatz für den produktiven Einsatz von KI-Agenten. Wer sich allein auf größere Modelle oder längere Context Windows verlässt, wird auf Dauer negative Konsequenzen daraus ziehen.
Erst die gezielte Auswahl, Aufbereitung und Verwaltung von Kontext macht Agenten nachvollziehbar, kontrollierbar und wirtschaftlich betreibbar. Für Unternehmen gilt deshalb: weniger basteln, mehr Architekturarbeit.