Open-Source-Lösung für Metadaten Mission KI startet Suchmaschine für Datensätze und Qualitätsbewertung

Von Berk Kutsal 1 min Lesedauer

Anbieter zum Thema

Die Initiative Mission KI hat mit „Daseen“ eine neue Suchmaschine für Datensätze vorgestellt. Ergänzt wird sie durch den Extended Dataset Profile Service (EDPS), der automatisch Metadaten generiert und so die Qualität von Daten transparent macht.

Das Team um die Initiative Mission KI will den Aufbau souveräner Daten-Ökosysteme vorantreiben, um die Datenbasis für KI-Innovationen zu verbessern. Vlnr: Dr. Emanuel Marx (acatech), Marius Bensley (acatech), Kai Meinke (deltaDAO), Andreas Huber (nexyo), Dr. Florian Mauer-Endler (beebucket).(Bild:  Mission KI / Christian Laukempe)
Das Team um die Initiative Mission KI will den Aufbau souveräner Daten-Ökosysteme vorantreiben, um die Datenbasis für KI-Innovationen zu verbessern. Vlnr: Dr. Emanuel Marx (acatech), Marius Bensley (acatech), Kai Meinke (deltaDAO), Andreas Huber (nexyo), Dr. Florian Mauer-Endler (beebucket).
(Bild: Mission KI / Christian Laukempe)

Künstliche Intelligenz (KI) benötigt saubere Daten. Doch Datensätze liegen häufig uneinheitlich vor und sind nur schwer auffindbar. Mit der Beta-Version der Datensatz-Suchmaschine Daseen will die Initiative Mission KI diese Lücke schließen. Unter www.daseen.de können Nutzer kostenfrei und ohne Registrierung auf rund 70.000 kuratierte Datensätze aus 29 Quellen zugreifen – darunter Verwaltungs-, Geo- und Wetterdaten.

Entwickelt wurde Daseen vom KI-Dienstleister beebucket, unterstützt von eXXcellent solutions, deltaDAO und nexyo. Die Software ist als Open Source auf GitHub verfügbar.

Steckbriefe für Daten

Neben der Suchfunktion spielt die Qualität der Datensätze eine zentrale Rolle. Dafür wurde der Extended Dataset Profile Service (EDPS) entwickelt. Der EDPS erstellt automatisiert Metadaten – sogenannte Datensteckbriefe –, die Informationen über Herkunft, Struktur und Qualität liefern. Datenanbieter können ihre Bestände so katalogisieren und nutzerfreundlich bereitstellen.

Der Ansatz folge dem Compute-to-Data-Prinzip. Statt Daten zu bewegen, werden die Algorithmen für die Metadaten-Erstellung lokal beim Anbieter ausgeführt. Genutzt werden etablierte Connector-Lösungen wie der Eclipse Data Space Connector. Damit bleibt die Datenhoheit gewahrt und zugleich entsteht ein einheitlicher Qualitätsstandard.

Das Team hat Daseen und EDPS in bestehende Datenräume eingebunden, darunter den Mobility Data Space und Pontus-X. Beide Komponenten seien interoperabel konzipiert und mit gängigen technischen Standards kompatibel.

Von der Lösung sollen Anbieter wie Nutzer gleichermaßen profitieren – ebenso Betreiber von Datenräumen und Portalen.

(ID:50543152)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung