DVPS: Europäische Initiative entwickelt multimodale KI-Systeme Mit KI zurück in die Realität

Von Berk Kutsal 2 min Lesedauer

Anbieter zum Thema

Statt auf immer größere Sprachmodelle zu setzen, geht Europa einen neuen Weg: Die Initiative DVPS will KI-Systeme entwickeln, die nicht nur Text und Bild verarbeiten, sondern durch Interaktion mit der realen Welt lernen. Der Anspruch: Kontext verstehen, statt nur Kontext simulieren.

Mit DVPS startet ein ehrgeiziges EU-Projekt für KI-Systeme, die aus realer Interaktion lernen. Ziel ist eine neue Generation kontextsensitiver Foundation-Modelle.(Bild:  Translated)
Mit DVPS startet ein ehrgeiziges EU-Projekt für KI-Systeme, die aus realer Interaktion lernen. Ziel ist eine neue Generation kontextsensitiver Foundation-Modelle.
(Bild: Translated)

Mit DVPS startet eines der bislang ambitioniertesten europäischen Projekte im Bereich Künstliche Intelligenz. Der Name – Diversibus Viis Plurima Solvo, lateinisch für „Auf vielen Wegen löse ich viele Probleme“ – ist Programm: Ziel ist es, eine neue Klasse multimodaler Foundation-Modelle zu entwickeln, die über Text und Bild hinausgehen und mit Sprache, visuellen Signalen sowie Sensordaten arbeiten. Im Fokus: Maschinen, die aus der realen Welt lernen.

DVPS ist laut eigenen Angaben eines der ambitioniertesten Forschungsvorhaben im Rahmen von Horizon Europe und soll mit 29 Millionen Euro gefördert werden. Es vereine zwanzig führende Partner aus neun Ländern. Geleitet wird die Initiative vom italienischen Sprachdienstleister Translated

Das Gründungsteam von DVPS besteht aus 70 führenden europäischen KI-Wissenschaftlerinnen und Wissenschaftlern aus den folgenden Partnerorganisationen:

  • Forschung: Universität Oxford, Alan Turing Institute, École Polytechnique Fédérale de Lausanne, ETH Zürich, Imperial College London, Fondazione Bruno Kessler, Karlsruher Institut für Technologie, Universitat de Barcelona und Vlaamse Instelling voor Technologisch Onderzoek
  • Vertikal spezialisierte Partner: Universitätsklinikum Heidelberg, Vall d'Hebron Institut de Recerca und Amsterdam University Medical Centers, Deepset, Sistema und MEEO, Lynkeus, Data Valley und Pi School of AI
  • Hochleistungsrechnen (Modelltraining): Cyfronet, Polens nationales HPC-Zentrum

Vom Text zum Tastsinn: Multimodalität als Versprechen

Während Tech-Giganten wie OpenAI, Google oder Anthropic weiter auf textlastige, skalierbare LLMs setzen, versucht DVPS einen alternativen Weg: Foundation-Modelle, die in Echtzeit mit ihrer Umgebung interagieren. Statt statische Trainingsdaten zu konsumieren, sollen künftige Modelle mit visuellen Signalen, räumlichen Audiodaten und Sensoreingaben verknüpft werden.

Ein Beispiel aus dem Projekt: KI-gestützte Übersetzungen in lauten Umgebungen. Während heutige Systeme meist rein audio- oder textbasiert arbeiten, sollen DVPS-Modelle den Sprecherkontext erfassen – etwa durch die Blickrichtung, Gestik, Geräuschquelle oder sogar die Position im Raum. So entstehe ein semantisches Netz aus Sprache und Raum – weit entfernt von den derzeitigen, rein korpusbasierten Systemen.

Anwendungsfelder: Medizin, Umwelt, Mensch-Maschine-Kommunikation

Die potenziellen Einsatzszenarien reichen wohl von der medizinischen Bildanalyse über Echtzeit-Übersetzung bis zur Katastrophenhilfe.

Laut Translated sollen die neuen Modelle:

  • im Gesundheitswesen ein 3D-Modell des Herzens erstellen, um kardiovaskuläre Risiken früher zu erkennen,
  • im Umweltbereich präzisere Hochwasservorhersagen ermöglichen – auf Basis von Satellitendaten, Drohnenaufnahmen und lokalen Sensoren,
  • in der Sprachtechnologie gesprochene Sprache im physischen Kontext interpretieren und in Echtzeit übersetzen – auch in lauter Umgebung oder bei mehreren Sprechern gleichzeitig.

Geopolitische Dimension: Europas Antwort auf LLM-Dominanz

DVPS ist nicht nur ein Technologieprojekt, sondern auch ein politisches Signal: Europa will in der KI-Forschung nicht nur mitlaufen, sondern strategisch eigene Wege gehen. Das Projekt ist eingebettet in den größeren Kontext von GAIA-X, ELLIS und der European AI Act-Initiative. Entscheidend wird sein, ob aus der Vision auch ein nachhaltiges Ökosystem entsteht – abseits von Pilotprojekten und symbolischen Leuchttürmen.

Mit DVPS formuliert Europa einen Gegenentwurf zum Silicon-Valley-Dogma der „größeren Modelle, mehr Daten“. Statt reiner Sprachkompetenz soll kontextuelle Intelligenz in die Systeme einziehen – durch echte Interaktion mit der physischen Welt.

(ID:50444336)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung