Die meisten Multi-Agenten-Systeme scheitern nicht an Kommunikationsproblemen, sondern am Gedächtnis, dem „Memory“. Das eigentliche Problem liegt nicht darin, dass die KI-Agenten nicht miteinander kommunizieren können, sondern, dass sie ihren Arbeitsstand nicht effektiv untereinander abgleichen und koordinieren können.
Die Autorin: Mikiko Bazeley ist Staff Developer Advocate bei MongoDB
(Bild: MongoDB)
In der Praxis führt das dazu, dass Agenten Aufgaben doppelt ausführen oder auf Basis inkonsistenter Informationen agieren. Eine weitere Folge kann sein, dass sie hohe Token-Budgets verbrauchen, indem sie sich gegenseitig immer wieder den gesamten Kontext erklären – Probleme, die mit jedem zusätzlichen Agenten exponentiell größer werden. Die Entwicklung eines leistungsfähigen „Gedächtnisses“ für KI-Agenten, das diese Fehler vermeidet, ist eine grundlegende Herausforderung. Das hat zur Entstehung eines neuen Fachgebiets geführt: dem Memory Engineering.
KI-Agenten-Gedächtnis: Die Grundlagen
Um die Koordination zwischen mehreren Agenten zu verstehen, muss zunächst die Grundlage erklärt werden: Das Agenten-Gedächtnis fungiert als eine Art computergestützter Exocortex – also als ausgelagertes Gedächtnis. Es ist ein dynamischer, systematischer Prozess, der das Gedächtnis des Agenten-Sprachmodells (Kontextfenster und parametrische Werte) mit einem persistenten Speichersystem verbindet, um Erfahrungen zu kodieren, zu speichern, abzurufen und zu verarbeiten. Inspiriert vom menschlichen kognitiven Gedächtnis, ermöglicht es KI-Agenten, Wissen anzusammeln, bei Aufgaben und Gesprächen den Faden nicht zu verlieren und ihr Verhalten auf Basis von früheren Erfahrungen anzupassen.
Der Schlüsselbegriff ist das Agenten-Gedächtnis (Agent Memory), doch die dahinterstehende Disziplin ist das sogenannte Memory Engineering. Memory Engineering liefert die fehlende architektonische Grundlage für Multi-Agenten-Systeme. Datenbanken haben einst Software von Einzelbenutzer-Programmen zu Mehrbenutzer-Anwendungen transformiert. Heute ermöglichen gemeinsame, persistente Speichersysteme der KI die Evolution vom einzelnen KI-Agenten-Werkzeug zum koordinierten Agenten-Team. Dieses ist dann in der Lage, Herausforderungen von unternehmensweiter Tragweite zu bewältigen.
Memory Engineering: Die notwendige Weiterentwicklung, die moderne KI antreibt
Memory Engineering hat sich als der entscheidende nächste Schritt nach Prompt und Context Engineering etabliert. Diese Disziplin geht über die reine Datenspeicherung hinaus und widmet sich der komplexen Aufgabe, kognitiv inspirierte Memory-Architekturen zu entwerfen. Sie umfasst die Optimierung von Abruf- und Synthesemechanismen sowie die Implementierung anspruchsvoller Strategien zum Lifecycle-Management – wie aktive Reflexion und kontrolliertes Vergessen. So wird sichergestellt, dass Agenten mit wachsender Erfahrung tatsächlich klüger werden, anstatt nur mit Informationen überladen zu sein.
Memory Engineering und Context Engineering arbeiten Hand in Hand. Memory Engineering errichtet persistente, intelligente Speichersysteme. Auf diese greift das Context Engineering dann zu, um für jede einzelne KI-Entscheidung dynamisch die relevantesten Informationen auszuwählen.
Wo die Fehler von Einzel-KI-Agenten liegen
KI-Agenten in Unternehmen leiden unter einem fundamentalen Konstruktionsfehler, der ihre Zuverlässigkeit untergräbt: Sie basieren auf zustandslosen Sprachmodellen (LLMs). Sie werden aber in zustandsbehafteten Geschäftsumgebungen eingesetzt, die Kontinuität und Situationsbewusstsein erfordern. Dieser Kernkonflikt bedeutet, dass Agenten ohne eine geeignete Daten-zu-Memory-Pipeline den nötigen Kontext nicht effektiv über einen längeren Zeitraum verwalten können.
Jeder KI-Agent hat mit vier Memory-Kernproblemen zu kämpfen:
Kontextvergiftung (Context Poisoning) tritt auf, wenn Halluzinationen zukünftige Gedankengänge kontaminieren und damit eine Feedback-Schleife von zunehmend ungenauen Antworten erzeugen.
Kontextablenkung (Context Distraction) entsteht, wenn zu viele Informationen den Entscheidungsprozess des Agenten überfordern, was letztlich zu suboptimalen Urteilen führt.
Kontextverwirrung (Context Confusion) ergibt sich, wenn irrelevante Informationen die Antworten beeinflussen, während ein Kontext-Konflikt (Context Clash) Inkonsistenzen erzeugt, weil widersprüchliche Informationen im selben Kontextfenster existieren.
Eine aktuelle Forschung von Chroma deckt ein weiteres kritisches Problem auf: Context Rot – die systematische Verschlechterung der Leistung von LLMs bei zunehmender Eingabelänge bzw. zu vielen Tokens, die verarbeitet werden müssen. Diese Beobachtung gilt selbst bei trivialen Aufgaben.
Koordination als Voraussetzung für funktionierende Multi-Agenten-Systeme
Einzelne Agenten haben bereits Schwierigkeiten, den Kontext über die Zeit zu managen. Das verschlimmert sich exponentiell, wenn Agenten zusammenarbeiten. In Multi-Agenten-Umgebungen ohne eine funktionierende Gedächtniskoordination bleiben Fehler nicht isoliert. Agenten leisten doppelte Arbeit, operieren auf Basis unterschiedlicher Realitätsversionen und müssen sich ständig gegenseitig den Kontext und frühere Entscheidungen neu erklären. Das größte Risiko sind Kaskadenfehler, bei denen sich Kontextfehler eines Agenten durch gemeinsame Interaktion auf andere Agenten ausbreiten.
Dieses Koordinationsversagen ist ohne Memory Engineering architektonisch unvermeidlich. Memory Engineering ist daher kein optionales Feature, sondern eine grundlegende Voraussetzung für jedes funktionsfähige Multi-Agenten-System.
Hoher Einsatz, hoher Gewinn: Die Zukunft des kollektiven Gedächtnisses
Die fünf Säulen des Memory Engineerings für Multi-Agenten-Systeme
(Bild: MongoDB)
Die meisten bisher entwickelten Techniken des Memory Engineerings konzentrieren sich auf die Optimierung einzelner Agenten, nicht auf Multi-Agenten-Systeme. Ein Multi-Agenten-System erfordert jedoch sowohl die Gedächtnisfähigkeiten einzelner Agenten als auch anspruchsvolle Mechanismen zum Teilen, Integrieren und Verwalten von Informationen über das gesamte KI-Agenten-Team hinweg. Die Koordination zwischen mehreren Agenten erfordert fundamental neue Memory-Strukturen und -Muster, die Einzel-Agenten-Systeme nie gebraucht haben. Multi-Agenten-Systeme erfordern Innovationen wie ein Konsens-Gedächtnis (Consensus Memory) für verifizierte Teamprozesse, Persona-Bibliotheken (Persona Libraries) für eine rollenbasierte Koordination und Whiteboard-Methoden (Whiteboard Methods) für die kurzfristige Zusammenarbeit. Diese Strukturen werden erst dann notwendig, wenn Agenten zusammenarbeiten sollen.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Am wichtigsten ist jedoch, dass es mit Multi-Agenten-Systemen möglich ist, in ein kollektives Gedächtnis zu investieren, das sowohl die aktuelle Leistung als auch die zukünftigen Fähigkeiten der Agenten verbessert. Der wirtschaftliche Einsatz für die Gestaltung dieses kollektiven Gedächtnisses ist immens. Eine interne Untersuchung von Anthropic aus dem Jahr 2025 zeigt, dass einzelne Agenten üblicherweise etwa viermal mehr Tokens verbrauchen als Chat-Interaktionen. Multi-Agenten-Systeme benötigen sogar etwa 15-mal mehr Tokens, was sie nur für hochwertige Aufgaben rentabel macht. Doch wenn Koordination und Gedächtnis zusammenarbeiten, ist der Ertrag enorm. Die Anthropic-Studie belegt beispielsweise auch, dass ein Multi-Agenten-System mit Claude Opus 4 als leitendem Agenten und Claude Sonnet 4 als Sub-Agenten die Leistung eines einzelnen Claude Opus 4 Agenten um über 90 Prozent übertreffen konnte.
Die fünf Säulen des Memory Engineerings für Multi-Agenten-Systeme
Wenn man Memory Engineering von Multi-Agenten-Systemen erfolgreich gestalten will, reicht der architektonische Unterbau für Einzel-Agenten nicht aus. Diese fünf Bausteine sind die Grundlage für skalierbare Multi-Agenten-Systeme:
1. Beständige Architektur (Speicherung und Zustandsverwaltung): Multi-Agenten-Systeme benötigen anspruchsvolle Speichermuster, die eine koordinierte Zustandsverwaltung über Agenten-Teams hinweg ermöglichen.
2. Intelligenter Informationsabruf (Auswahl und Abfrage): Die Komplexität, die richtige Information zur richtigen Zeit abzurufen, wächst exponentiell, wenn mehrere Agenten gleichzeitig auf ein gemeinsames Gedächtnis zugreifen. Die Lösung besteht darin, eine sinnbasierte Suche mit auf den Agenten zugeschnittenen Anfragen zu kombinieren und das Ganze zeitlich und mit Blick auf die Systemauslastung zu steuern.
3. Performance-Optimierung (Komprimierung and Caching): Optimierung wird entscheidend, da die Kontextkosten für Agenten-Teams schnell steigen. Techniken wie hierarchische Zusammenfassung, selektives intelligentes Verwerfen von Informationen und Agenten-übergreifende Cache-Optimierung helfen hier.
4. Koordinationsgrenzen (Isolation und Zugriffs-Kontrolle): Um zu verhindern, dass Fehler eines Agenten das ganze Team anstecken, braucht es klare Grenzen, die aber gleichzeitig effektives Zusammenarbeiten ermöglichen. Methoden wie die Orchestrierung von Arbeitsabläufen und der Einsatz spezialisierter Gedächtnis-Management-Agenten sind essenziell.
5. Konfliktlösung (Umgang mit simultanen Updates): Wenn zwei Agenten gleichzeitig versuchen, dieselbe Information im gemeinsamen Gedächtnis zu ändern (vielleicht sogar gegensätzlich), muss das System solche Konflikte elegant lösen können. Das kann z. B. durch Versionskontrolle oder priorisierte Zugriffsregeln geschehen. Das stellt sicher, dass das gemeinsame Lagebild bei konkurrierenden Updates konsistent bleibt.
Fazit
Multi-Agenten-Memory-Engineering ist erst dann erfolgreich, wenn Agenten-Teams Probleme lösen können, die für einzelne Agenten unmöglich sind – und das auch zu wirtschaftlich vertretbaren Kosten, die den Einsatz rechtfertigen. Erfolg bedeutet hier den Übergang von „Agenten, die Menschen helfen“ zu „Agenten-Teams, die Probleme eigenständig lösen“. Das macht den Unterschied zwischen einem bloßem KI-Werkzeug und einem autonomem KI-Teamkollegen aus.
Mit zunehmender Verbreitung von KI in Unternehmen wird die Bedeutung des Memory Engineerings voraussichtlich drastisch steigen. Unternehmen könnten dann spezialisierte „AI Memory“-Teams bilden, und das Memory Engineering wird sich zu einer Schlüsselqualifikation eines jeden modernen KI-Ingenieurs entwickeln.