Token-Kosten fressen KI-Budgets Pegasystgems will das Preismodell kippen

Von Berk Kutsal 2 min Lesedauer

Anbieter zum Thema

Das Skalierungsproblem agentenbasierter KI trifft Unternehmen gerade mit voller Wucht: Je mehr Workflows in die Produktion wandern, desto höher die Token-Rechnung und desto unzuverlässiger die Ergebnisse. Pegasystems greift das Problem architektonisch an. Mit Pega Infinity 26 soll das Reasoning aus dem laufenden Betrieb verschwinden. Abgerechnet wird dann pro erledigter Aufgabe.

Je komplexer ein Workflow, desto mehr Token und desto höher die Rechnung. Pegasystems will das mit einem anderen Architekturprinzip durchbrechen.(Bild:  Pegasystems)
Je komplexer ein Workflow, desto mehr Token und desto höher die Rechnung. Pegasystems will das mit einem anderen Architekturprinzip durchbrechen.
(Bild: Pegasystems)

Wer KI-Agenten aus dem Pilotbetrieb in die Produktion schiebt, erlebt derzeit eine unangenehme Erkenntnis: Das tokenbasierte Preismodell der LLM-Anbieter bestraft genau die Szenarien, für die KI-Agenten eigentlich gebaut wurden. Komplexe Workflows bedeuten mehr Reasoning-Schritte, mehr Token und damit höhere Kosten. Paradoxerweise steigt mit dem Aufwand auch die Fehlerquote. ServiceNow und Uber sollen ihre KI-Token-Jahresbudgets bereits vor Jahresmitte aufgebraucht haben. Das ist kein Randproblem.

Reasoning raus aus der Laufzeit

Pegasystems reagiert darauf nicht mit einem günstigeren Token-Deal, sondern mit einem anderen Architekturprinzip. Die sogenannte Predictable-AI-Architektur in Pega Infinity 26 verlagert das rechenintensive Reasoning konsequent in die Entwurfsphase. Werkzeuge wie Pega Blueprint AI und das neue Infinity Studio helfen dabei, optimale Workflows vorab zu modellieren, für Kreditgenehmigungen, Schadensfallprüfungen oder Kundenanfragen. Im Betrieb folgen Agenten diesen vorab definierten Abläufen, statt bei jedem Request eigenständig zu schlussfolgern. LLM-Aufrufe erfolgen nach Herstellerangaben nur noch punktuell, etwa beim Parsen von Dokumenten oder dem Zusammenfassen von Gesprächsverläufen.

Das ist im Prinzip der Ansatz, den Pega bereits mit seinen Predictable AI Agents aus dem Vorjahr verfolgt. Neu ist die dazugehörige Preisstrategie.

Einsparungen von 95 Prozent

Um den Vorteil greifbar zu machen, stellt Pegasystems einen AI Token Cost Calculator bereit, der auf Basis eigener Workflow-Volumina eine Gegenüberstellung zum tokenbasierten Wettbewerb liefert. Die versprochenen Einsparungen von über 95 Prozent sind allerdings eine Herstellerangabe ohne unabhängige Verifizierung.

Bezahlen für das Ergebnis, nicht für das Grübeln

Das Preismodell von Pega Infinity 26 folgt der Logik des Ansatzes: ein Pauschalpreis pro abgeschlossenem Fall, unabhängig davon, wie viel KI-Infrastruktur dahintersteckt. Damit koppelt Pegasystems die Kosten direkt an den geschäftlichen Nutzen, nicht an den Rechenaufwand.

„Unternehmen wird immer klarer, dass Tokenmaxxing unsinnig ist. Es führt nur zu untragbaren Kosten und unvorhersehbaren Ergebnissen“, sagt Alan Trefler, Gründer und CEO von Pegasystems. „Deshalb berechnen wir unseren Kunden keine Gebühren basierend auf der Anzahl der verwendeten Tokens, sondern nach der sinnvollen Arbeit, die agentenbasierte KI leistet.“

Pega Infinity 26 soll ab dem dritten Quartal 2026 verfügbar sein.

(ID:50865407)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung