In vielen Finanzinstituten wird bereits multimodale Künstliche Intelligenz (KI) genutzt. Sie verarbeitet unterschiedliche Datentypen und entwickelt so ein besseres Verständnis für Inhalt und Kontext. Doch die Evolution der Technologie geht weiter. Die nächste Stufe: KI-Agenten, die in der Lage sind, eigene Lösungswege zu entwickeln. Das ist ein nächster Entwicklungsschritt auf dem Weg zur hybriden Belegschaft aus Mensch und Maschine.
Der Autor: Benedikt Höck ist Head of Artificial Intelligence für KPMG in Deutschland
(Bild: KPMG)
Seit Februar 2025 steht fest: Unternehmen sollten ihren Mitarbeiterinnen und Mitarbeitern eine KI-Kompetenz vermitteln. Das ist durch den EU AI Act vorgeschrieben. Betroffen sind alle Akteure, die KI-Systeme nutzen oder anbieten. Die Kompetenz soll den Mitarbeiterinnen und Mitarbeitern über wiederkehrende Schulungen und Fortbildungen vermittelt werden. Rechtlich heikel wird es gerade dann, wenn Mitarbeiterinnen und Mitarbeiter KI unerlaubterweise nutzen. Und das machen laut einer Studie von Microsoft und LinkedIn ungefähr 71 Prozent der Belegschaft in deutschen Unternehmen.
Allein dieser Umstand sollte Unternehmen dazu bringen, ihre Mitarbeiter in KI zu schulen. Doch es wäre zu kurz gedacht, den AI Act bloß als ein weiteres regulatorisches Framework anzusehen. Denn breit verankerte KI-Kompetenz legt nicht nur den Grundstein für einen sicheren, sondern auch produktiven Umgang mit der Technologie. Unternehmen sorgen so dafür, dass sie im Angesicht der rasend schnellen Entwicklung auf diesem Feld nicht ins Stolpern geraten. Positiv formuliert: Sie tragen heute zum Unternehmenserfolg von morgen bei.
Multimodale KI – der Blick über den Daten-Tellerrand
Seit dem Durchbruch von ChatGPT Ende 2022 hat sich die Entwicklung von KI in einem deutlich beschleunigten Tempo vollzogen. Der von OpenAI entwickelte Chatbot löste einen globalen Boom aus und setzte neue Maßstäbe für menschenähnliche Sprachverarbeitung und intuitive Interaktion. Innerhalb weniger Monate folgte eine Innovation auf die nächste. Der Markt wurde schnell mit neuen Anwendungen erweitert.
Schnell waren ChatGPT und andere KI-Modelle wie Gemini oder Claude in der Lage, nicht nur Text, sondern auch Bilder und gesprochene Sprache zu verarbeiten – und zu erzeugen. Solche multimodalen KI-Modelle können unterschiedliche Datentypen miteinander kombinieren und entwickeln so, im Vergleich zu klassischen Systemen, ein tieferes Verständnis für die zu verarbeitenden Inhalte und deren Kontexte.
Der Unterschied zwischen beiden Modellen lässt sich an einer Finanz-KI veranschaulichen: Ein monomodales System greift auf Finanzdaten von Unternehmen zurück und ergänzt diese um weitere Wirtschafts- und Industriedaten. Sie sind Grundlage für Risikoanalysen oder Finanzprognosen. Eine multimodale KI verfügt über einen größeren „Datenhorizont“. Dieser kann zum Beispiel Satellitenbilder, Grafiken oder Diagramme einbeziehen. Auch Finanzpodcasts oder Vorstandsreden können relevante Quellen sein. Vorhersagen auf dieser Basis berücksichtigen eine größere Datenvielfalt und können komplexe Zusammenhänge besser abbilden.
Agentic AI: Künstliche Intelligenz wird flügge
Multimodale KI erzielt jedoch nicht nur differenziertere Ergebnisse. Sie erweist sich auf der Arbeit im Vergleich zu beispielsweise rein textbasierten Modellen auch als der bessere Umgang. So ermöglicht es multimodale KI, mit Computern ähnlich zu kommunizieren wie mit Menschen. Nutzende können nicht nur ihre Frage eintippen, sondern auch einsprechen. Sie können ihr Bilder zeigen. Selbst Mimik und Gestik sind potenzielle Kommunikationskanäle. Die Vorstellung vom Computer als echten Kollegen wird somit fast schon real.
Die nächste Evolutionsstufe deutet sich nun mit sogenannten KI-Agenten an. Sie sind in der Lage, Aufgaben nicht bloß automatisiert zu erledigen, sondern autonom, proaktiv und intelligent. Im Gegensatz zu bisherigen KI-Systemen, die nur auf direkte Eingaben reagieren, können sie eigenständig Entscheidungen treffen, mit digitalen Umgebungen interagieren und komplexe Abläufe selbstständig steuern. Damit könnte sich in naher Zukunft eine Neuausrichtung vollziehen – vom passiven Tool zum autonomen, intelligenten Partner.
Wo Mensch und Maschine sich treffen
Der Begriff der „hybriden Belegschaft“ würde dadurch eine Bedeutungserweiterung erfahren. Er bezeichnet nicht länger nur ein Arbeitsmodell, das Präsenz- und Remote-Arbeit kombiniert, sondern auch die Zusammenarbeit zwischen menschlichen und KI-basierten Mitarbeitern. Dabei bleibt der Mensch im Zentrum der Kundenbeziehung. Der virtuelle Partner verbleibt im Hintergrund. Möchte ein Kunde zum Beispiel einen Immobilienkredit beantragen, analysiert die KI automatisch alle relevanten Kundendaten, prüft die Bonität, bewertet die Immobilie, zieht aktuelle Marktdaten heran und erstellt verschiedene Kreditvorschläge. All das, während der Mensch vor dem Bildschirm Fragen beantwortet und Missverständnisse ausräumt.
Doch damit das Zusammenspiel zwischen Mensch und Maschine stimmt, kommt es nicht allein auf die Fähigkeiten der KI an. Auch der menschliche Analyst, Kundenberater, Risikomanager oder Backoffice-Mitarbeiter muss seinen Beitrag leisten. Der EU AI Act wird dabei eine zentrale Rolle spielen. Zum einen schafft die Verordnung einen verbindlichen Rechtsrahmen, der für Sicherheit und Transparenz im Umgang mit KI sorgt. Gleichzeitig verpflichtet sie Unternehmen zu Schulungen und Weiterbildungen mit dem Ziel, eine KI-Kompetenz (engl. AI Literacy) zu vermitteln. Diese umfasst Fähigkeiten, Kenntnisse und das Verständnis, die es allen Beteiligten – also Anbietern, Betreibern und betroffenen Personen – ermöglichen, KI-Systeme sachkundig einzusetzen und sich der Chancen, Risiken und möglicher Schäden bewusst zu sein.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Die synergetische Beziehung zwischen Mensch und Maschine wird die Zukunft der Arbeit mitgestalten. In dieser Zukunft bringt der Mensch seine Stärken in Kreativität, Empathie und strategischem Denken ein. Künstliche Intelligenz übernimmt repetitive Aufgaben und sorgt für effizientere Arbeitsprozesse. Letztlich ist der Weg zur hybriden Belegschaft eine spannende Reise, die Chancen für Wachstum und Erneuerung bietet. Wenn Unternehmen mutig voranschreiten und die Herausforderungen annehmen, werden sie in der Lage sein, das volle Potenzial von Mensch und Maschine auszuschöpfen.