Offene Datenstandards für KI Snowflake & Co. starten OSI-Initiative

Von Berk Kutsal 2 min Lesedauer

Anbieter zum Thema

Snowflake hat gemeinsam mit Partnern wie Salesforce, BlackRock, dbt Labs und Mistral die Open Semantic Interchange (OSI) gestartet. Die Open-Source-Initiative adressiert das Problem fragmentierter Datendefinitionen über verschiedene Tools und Plattformen. Ihr Ziel ist ein offener Standard, der Unternehmen konsistente Geschäftslogik in KI- und BI-Anwendungen ermöglicht.

Verschiedene Partner starten die Open Semantic Interchange (OSI) für einheitliche semantische Datenmodelle in KI- und BI-Anwendungen.(Bild:  Snowflake)
Verschiedene Partner starten die Open Semantic Interchange (OSI) für einheitliche semantische Datenmodelle in KI- und BI-Anwendungen.
(Bild: Snowflake)

Ein zentrales Hindernis für Daten- und KI-Teams liegt laut Snowflake in der fehlenden Einheitlichkeit semantischer Modelle. Metriken wie Umsatz, Deckungsbeitrag oder Kundensegment seien in unterschiedlichen Tools oft verschieden definiert. Selbst kleine Abweichungen führten zu widersprüchlichen Ergebnissen und in Folge zu Vertrauensverlust in Analysen.

Die Open Semantic Interchange Initiative (OSI) solle genau hier ansetzen. Sie führt eine offene, herstellerneutrale Spezifikation ein, die semantische Modelle übergreifend beschreibt. Anstatt dass jedes System eigene Logik und Kennzahlen unabhängig interpretiert, könnten Daten- und KI-Workflows auf ein gemeinsames semantisches Gerüst zugreifen.

Christian Kleinerman, EVP of Product bei Snowflake, erklärte, die Branche arbeite damit erstmals an einer offenen Antwort auf das Fehlen eines Standards für semantische Modelle.

YAML-Spezifikation und Mapping-Module

Technisch baut OSI auf einer YAML-Struktur auf. Damit lassen sich Metriken, Dimensionen und Relationen maschinenlesbar definieren. Ein semantisches Modell könne so unabhängig von einer konkreten Plattform beschrieben werden.

Der Ansatz sieht zudem Mapping-Module vor: Diese Komponenten übersetzen OSI-Modelle in die Syntax und Semantik spezifischer Werkzeuge. Ein Modell ließe sich so in dbt, in Snowflake oder in BI-Tools wie ThoughtSpot oder Sigma einbinden, ohne dass die Definition jedes Mal neu geschrieben werden müsste.

Die Initiative beschreibt diesen Ansatz als Möglichkeit, vorhandene Systeme zu verbinden, statt sie zu ersetzen. Unternehmen sollen damit die Freiheit behalten, Tools zu kombinieren, während die semantische Konsistenz gewahrt bleibt.

Allianz mit vielen, aber (noch) nicht mit allen

Getragen wird die Open Semantic Interchange von Branchen- und Technologieanbietern gemeinsam mit einer wachsenden Partnerallianz, zu der unter anderem Alation, Atlan, BlackRock, Blue Yonder, Cube, dbt Labs, Elementum AI, Hex, Honeydew, Mistral AI, Omni, RelationalAI, Salesforce, Select Star, Sigma, Snowflake und ThoughtSpot gehören.

„Die Open Semantic Interchange sehen wir als logische Weiterführung unseres Ansatzes, da sie das grundlegende Problem isolierter und inkompatibler Datendefinitionen angeht“, so Ryan Segar, Chief Product Officer von dbt Labs.

OSI ist als Open-Source-Projekt angelegt und soll laut Snowflake und Partnern gemeinsam mit der Community entwickelt werden. Alle Interessierten könnten sich beteiligen und zur Ausgestaltung der Spezifikation beitragen. Damit soll ein Konsortium entsteht, das eine offene Grundlage für skalierbare KI- und BI-Projekte etablieren will.

(ID:50569728)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung