Continual Learnings Warum KI-Modelle ab Tag eins veralten und wie Wakeline das ändern will

Von Berk Kutsal 4 min Lesedauer

Anbieter zum Thema

Produktive KI-Modelle veralten ab dem Tag ihres Deployments: Sie bleiben auf dem Stand ihres letzten Trainings, bis ein Team sie aufwendig nachtrainiert. Das Düsseldorfer Start-up Wakeline hält diesen Kompromiss für vermeidbar und hat dafür 2,1 Millionen Euro Pre-Seed-Kapital eingesammelt. Hinter der Finanzierung steht eine streitbare These über die Architektur von KI.

Kleine Ursache, große Wirkung: In volatilen Märkten veraltet ein statisch trainiertes KI-Modell schneller, als es nachtrainiert werden kann.(Bild:  Midjourney / KI-generiert)
Kleine Ursache, große Wirkung: In volatilen Märkten veraltet ein statisch trainiertes KI-Modell schneller, als es nachtrainiert werden kann.
(Bild: Midjourney / KI-generiert)

Geht ein KI-Modell in den produktiven Betrieb, beginnt es zu veralten. Die Welt, auf die es trainiert wurde, verschiebt sich: Märkte bewegen sich, Betriebsbedingungen ändern sich, Datenverteilungen driften. Das Modell merkt davon nichts. Es bleibt auf dem Stand seines letzten Trainings, bis ein Team es nachtrainiert, validiert und neu ausrollt. Bis dahin liegt es hinter der Realität.

Dieser Zustand gilt als normal. Retraining-Zyklen, Drift-Monitoring und regelmäßige Modell-Updates, der gesamte MLOps-Apparat existiert, um ein Modell zu verwalten, das aus sich heraus nicht lernt. Das 2025 gegründete Start-up Wakeline stellt die Frage, ob dieser Kompromiss zwangsläufig ist. Lead-Investor der Pre-Seed-Runde ist der Aachener TechVision Fonds, beteiligt ist Neoteq Ventures aus Köln. Die Summe ist für diese Phase üblich und sagt wenig über die technische Reife. Interessanter ist allerdings das Problem, an dem das Team arbeitet.

Das Dilemma hinter dem kontinuierlichen Lernen

Kontinuierliches Lernen ist keine neue Idee: Online Learning, inkrementelles Lernen und adaptive Systeme sind seit Jahren Forschungsgegenstand. Dass produktive Systeme trotzdem fast nie im Betrieb lernen, hat einen handfesten Grund: „Catastrophic Forgetting“. Lernt ein neuronales Netz fortlaufend neue Daten, überschreibt es tendenziell das zuvor Gelernte. Es gewinnt Aktualität und verliert Stabilität.

Dahinter steht das Stabilitäts-Plastizitäts-Dilemma. Ein System muss formbar genug sein, um Neues aufzunehmen, und stabil genug, um Bewährtes zu behalten. Etablierte Verfahren wie Elastic Weight Consolidation, Replay-Puffer oder progressive Netzarchitekturen mildern den Effekt, lösen ihn aber nicht grundlegend.

Ein anderer aktuell diskutierter Weg, das Vergessen ohne aufwendiges Nachtrainieren zu verhindern, setzt auf Self-Distillation, bei der ein Modell als sein eigener Lehrer auftritt und neues Wissen innerhalb seiner bestehenden Parameter-Struktur verfeinert. Wakeline schlägt die entgegengesetzte Richtung ein. Hinzu kommt das Validierungsproblem. Ein Modell, das sich permanent verändert, lässt sich nicht einmal abnehmen und dann dauerhaft vertrauen. Das wiegt besonders schwer in regulierten oder sicherheitskritischen Umgebungen. Wie wenig isolierte Testergebnisse über reale Einsatzfähigkeit aussagen, hat der Stanford AI Index Report 2026 zuletzt für die Benchmark-Welt dokumentiert.

Wakelines These: Trennung statt geteilter Gewichte

Wakelines Ausgangspunkt ist eine Diagnose des Problems. Catastrophic Forgetting entstehe, weil in einem konventionellen neuronalen Netz alles Wissen im selben Parameterraum liege. Jedes Update, das Neues kodiert, verschiebe zwangsläufig auch die Parameter, die Altes kodieren. Neues und altes Wissen seien am Ort der Speicherung verflochten. Das Unternehmen bezeichnet das nach eigener Darstellung als architektonisches Problem, nicht als bloße Trainingsfrage.

Die vorgeschlagene Antwort beruht auf zwei Prinzipien. Erstens auf Separation. Neue Information wird nicht sofort in den bestehenden Parameterraum eingeschmolzen, sondern zunächst in einer getrennten Struktur gehalten, wo sie bewertet, revidiert oder verworfen werden kann, ohne vorhandenes Wissen zu beschädigen. Zweitens auf zeitlicher Tiefe. Wiederholt bestätigtes Wissen verfestigt sich zu stabileren Repräsentationen, während Vorläufiges leicht revidierbar bleibt. Aus diesem Grund verzichtet Wakeline nach eigenen Angaben auf konventionelles Deep Learning. Erfahrung soll gerade nicht in geteilten Gewichten abgelegt werden.

An diesem Punkt wird das Schlagwort vom biologisch inspirierten Ansatz konkret. Wakeline beruft sich auf die Arbeitsteilung zwischen Hippocampus und Neocortex im Gehirn: schnelles, episodisches Lernen in einer separaten Struktur, getrennt vom integrierten Langzeitwissen, mit gradueller Konsolidierung über die Zeit. Das Prinzip ist in den Neurowissenschaften als Complementary Learning Systems bekannt und auch in der KI-Forschung nicht neu. Neu wäre allenfalls die konkrete Umsetzung.

Und genau hier liegt die Grenze des Überprüfbaren. Wakeline begründet ausführlich, warum eine solche Architektur nötig wäre und was sie ermöglichen würde. Wie das Unternehmen Separation und zeitliche Tiefe konkret implementiert, mit welchem Mechanismus und mit welcher Leistung gegenüber den etablierten Verfahren, legt es bislang nicht offen. Es gibt keine veröffentlichten Benchmarks und keine Forschungspublikation. Den Aufbau belastbarer Evidenz nennt Wakeline selbst als laufende Aufgabe.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Der erste Anwendungsfall: Strompreisprognosen

Am konkretesten wird das Konzept dort, wo das Team zuerst liefern will. Das erste Produkt heißt Market Edge und liefert nach Herstellerangaben adaptive 24-Stunden-Prognosen für Day-Ahead-Strompreise (SDAC) in europäischen Gebotszonen. Zielgruppe sind Betreiber von Batteriespeichern, Energiehändler und Infrastrukturteilnehmer, die auf präzise Day-Ahead-Prognosen angewiesen sind, um Einsatz und Erlöse zu optimieren.

Der Anwendungsfall passt zur These. Strommärkte sind volatil und regimegetrieben, Preise und Einspeisung schwanken kurzfristig und stark. In einer solchen Umgebung könnte ein Modell, das sich laufend anpasst, einem periodisch nachtrainierten überlegen sein. Beweisen muss sich das an realer Prognosegüte gegenüber etablierten Verfahren.

Anspruch und Wirklichkeit

Wakeline arbeitet an einer der substanziellen offenen Fragen der KI-Entwicklung und gehört zur selteneren Sorte Start-up, die die Architektur selbst angreift, statt nur das Modell darauf zu optimieren. Die Diagnose des Verflechtungsproblems ist sauber, die vorgeschlagene Lösung in sich schlüssig. Bewiesen ist sie damit nicht.

Wakeline positioniert sich nicht als Spezialanbieter für Energieprognosen, sondern als anderer Weg zur Künstlichen allgemeinen Intelligenz, als neue Spezies von Intelligenz. Für ein Pre-Seed-Unternehmen mit 2,1 Millionen Euro ist die Distanz zwischen diesem Anspruch und dem aktuellen Reifegrad beträchtlich. Der überprüfbare Kern ist heute ein Energiemarkt-Produkt mit einer plausiblen, aber unbelegten technischen These dahinter. Die kommenden Monate, in denen Market Edge an einem realen Markt Prognosegüte zeigen muss, werden mehr aussagen als jede Architektur-Beschreibung.

(ID:50878798)