Bessere Vernetzung des Datenökosystems MISSION KI entwickelt neuartige Datensatz-Suchmaschine

Von Bernhard Lück 2 min Lesedauer

Anbieter zum Thema

MISSION KI, ein Projekt der acatech – Deutsche Akademie der Technikwissenschaften, entwickelt die „Landing Page“ für eine übergreifende Suche von Datensätzen in öffentlichen und privaten Datenportalen und -räumen, inklusive einer Analyse der Datenqualität.

Ein erster Demonstrator der Landing Page wurde im Rahmen der Konferenz „Datenmärkte 2024“ des Bundesministeriums für Digitales und Verkehr (BMDV) in Berlin vorgestellt.(Bild:  MISSION KI)
Ein erster Demonstrator der Landing Page wurde im Rahmen der Konferenz „Datenmärkte 2024“ des Bundesministeriums für Digitales und Verkehr (BMDV) in Berlin vorgestellt.
(Bild: MISSION KI)

Künstliche Intelligenz benötigt für effektives Training und präzise Vorhersagen vor allem qualitativ hochwertige Daten. Obwohl täglich enorme Datenmengen entstehen, liegt nur ein Teil davon in verwertbarer, kuratierter Form vor. Eine zentrale Herausforderung besteht darin, dass bisher keine Suchfunktion existiert, die über verschiedene Datenräume und -portale hinweg gezielt nach Datensätzen suchen kann. Zudem liegen Daten häufig ohne Qualitätsbeschreibungen, sogenannte Datensteckbriefe, vor.

MISSION KI adressiert diese Themen mit der sogenannten Landing Page. Ein erster Demonstrator der Landing Page wurde am 3. Dezember 2024 im Rahmen der Konferenz „Datenmärkte 2024“ des Bundesministeriums für Digitales und Verkehr (BMDV) in Berlin vorgestellt.

Darüber hinaus entwickelt MISSION KI mit den Start-ups beebucket, nexyo, eXXcellent solutions und deltaDAO einen dezentralen Service zur automatischen Katalogisierung der Datenqualität. Dieser „Extended Dataset Profile Service“ (EDPS) basiere auf einer Open-Source-Software-Lösung und sei zentral verfügbar. Datenanbieter sollen mit dem neuen Service die Möglichkeit erhalten, ihre Daten aus unterschiedlichen Quellen automatisch zu katalogisieren, zu kuratieren und anhand standardisierter Meta-Informationen auffindbar und bewertbar zu machen. Die Qualität der Daten werde dabei durch industrierelevante Standards transparent gemessen. Sind die Daten auf diese Weise katalogisiert und mit entsprechenden Datensteckbriefen versehen, könnten Datennutzer diese manuell oder maschinell über Datenräume und Datenportale hinweg anhand der standardisierten Meta-Informationen finden – ohne Zugriff auf die Daten selbst. Die Datennutzer könnten somit gezielt die benötigten und geeigneten Daten auswählen.

Manfred Rauhmeier, Vorsitzender der acatech-Stiftung und Sekretär des acatech-Koordinationskomitees: „Die neue Landing Page in Kombination mit den Datensatz-Steckbriefen ist ein bedeutender Schritt, um den Zugang zu verschiedenen Datenräumen zu verbessern und valide Daten für das Training von KI-Modellen noch effektiver zu nutzen. Sie schafft das nötige Vertrauen für sicheres Datenteilen zwischen Organisationen und ermöglicht so einen echten Datenmarkt. Mit dieser erweiterten Datenbasis eröffnen sich deutschen und europäischen Unternehmen neue, innovative Geschäftsmodelle.“

Florian Mauer-Endler, geschäftsführender Gesellschafter beebucket: „Vertrauenswürdige KI benötigt qualitativ hochwertige und passgenaue Daten. Mit der Entwicklung der beiden Dienste schaffen wir eine effiziente Basis für ein föderales und rechtssicheres Datenökosystem, das sich nahtlos in die bestehende Datenportal- und Datenraumlandschaft integriert und diese ergänzt. Gleichzeitig vereinfachen wir die Prozesse der Kuratierung, Katalogisierung und Freigabe von Daten für den Datenanbieter sowie die Suche und Beschaffung passgenauer Daten für den Datennutzer.“

Von den Software-Lösungen würden datenanbietende und datennutzende Unternehmen gleichermaßen profitieren, ebenso wie Betreiber von Datenräumen, Datenportalen und sonstigen Datenökosystemen. Datenanbieter könnten durch die Datensatz-Steckbriefe eine bessere Auffindbarkeit ihrer Daten gewährleisten und hierdurch Kunden gewinnen. Datennutzer hätten den Vorteil, dass sie datenraumübergreifend gezielt nach Datensätzen suchen könnten, um diese für das Training von KI-Modellen zu verwenden. Betreiber von Datenräumen und Datenportalen schließlich würden von einer höheren Sichtbarkeit und mehr Reichweite profitieren, da neue Kundengruppen angesprochen und auf ihre Plattformen geleitet würden.

(ID:50257869)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung