Definition Was ist Egeria?

Egeria ist ein Open-Source-Standard der Open Data Platform initiative (ODPi). Er soll die Verwaltung und den plattform- und herstellerunabhängigen Austausch von Metadaten vereinfachen. Der Standard stellt die Integrationslogik, offene Application Programming Interfaces (APIs) und Formate für den Austausch und das Teilen von Metadaten in heterogenen Datenstrukturen zur Verfügung.

Anbieter zum Thema

(Bild: © aga7ta - stock.adobe.com)

Egeria ist der Name eines Open-Source-Standards für den vereinfachten Austausch und die übergreifende Verwaltung von Metadaten. Die Open Data Platform initiative (ODPi) der Linux Foundation entwickelt und veröffentlicht den Standard. Egeria stellt die Integrationslogik, offene Application Programming Interfaces (APIs), Frameworks, Protokolle, Konnektoren und Formate zur Verfügung, die die Kontrolle, den automatisierten Austausch und das Teilen der Metadaten plattform- und herstellerunabhängig in heterogenen Datenstrukturen erleichtern.

Für die Integration und Synchronisation der Metadaten unterschiedlicher Plattformen und Tools kommen spezielle OMAG-Server (Open Metadata and Governance Server) zum Einsatz. Es entsteht eine Art von Peer-to-Peer-Metadaten-Übertragungsweg für einen offenen Metadaten-Austausch. Egeria steht unter Apache-2.0-Lizenz. Die aktuellste Version des Open-Source-Standards ist das Release 3.4 (Stand Dezember 2021).

Was sind Metadaten?

Um den Open-Source-Standard Egeria besser zu verstehen, zunächst einige grundlegende Informationen über Metadaten. Bei Metadaten, auch als Metainformationen bezeichnet, handelt es sich – vereinfacht ausgedrückt – um „Daten über Daten“. Metadaten sind strukturierte Daten über Merkmale und Eigenschaften anderer Daten oder Objekte. Mithilfe von Metadaten werden Daten beispielsweise indexiert, um sie zu durchsuchen oder IT-gestützt weiterzuverarbeiten. Grundsätzlich kann es sich bei Metadaten sowohl um Eigenschaften und Merkmale analog vorliegender Objekte als auch digitaler Daten handeln.

Metadaten sind entweder in den Daten oder dem Objekt selbst hinterlegt oder in einer externen Datenbank beziehungsweise Datensammlung gespeichert und dort über einen Link mit den Ursprungsdaten verknüpft. Für eine maschinelle, IT-gestützte Verarbeitung der Metadaten, müssen sie eine bestimmte Struktur besitzen und in einem vorgegebenen Format vorliegen oder in dieses Format gebracht werden.

Motivation und Zielsetzung

Für Geschäftsprozesse und moderne Anwendungen, beispielsweise im Big-Data- oder Business-Intelligence-Umfeld, müssen die Daten vieler verschiedener Plattformen und Tools verarbeitet und ihre Metadaten ausgetauscht und verwaltet werden. Die Tools und Plattformen unterschiedlicher Hersteller und Anbieter verwenden für die Metadaten eigene, teils proprietäre Formate und Strukturen, die eine übergreifende Synchronisierung der vorliegenden Informationen erschweren. In solch heterogenen Strukturen entstehen Metadaten-Silos, die einen übergreifenden Austausch der Metainformationen nur mit hohem manuellen Anpassungsaufwand gestatten. Der Open-Source-Standard Egeria soll dieses Problem lösen. Ziel der Open Data Platform initiative ist es, mit Egeria einen offenen Standard zu schaffen, der den Austausch, das Teilen, Synchronisieren und Verwalten der Metadaten vereinfacht. Die Metadaten sollen unabhängig von der Plattform, dem Tool oder dem Hersteller und Anbieter der Datenressourcen über die komplette Datenlandschaft automatisiert ausgetauscht werden können. Ein offener Metadaten-Zugriff erlaubt die transparente Arbeit mit den in den unterschiedlichen Plattformen vorliegenden Metadaten.

Funktionsweise von Egeria

Egeria definiert eine Integrationslogik und stellt offene Application Programming Interfaces, Frameworks, Protokolle, Konnektoren und Formate für das sichere, automatisierte Austauschen und Verwalten von Metadaten unter Apache-2.0-Lizenz zur Verfügung. Es entsteht ein transparentes Verzeichnis an Datenressourcen, auf deren Metadaten einfach zugegriffen werden kann und die leicht zu verwalten und zu kontrollieren sind. Über eine Art von Peer-to-Peer-Metadaten-Übertragungsweg sind die Datenressourcen und -plattformen miteinander verbunden.

Egeria ist modular aufgebaut und lässt sich an verschiedene Plattformen und Systeme anpassen. Das Herzstück bildet eine sogenannte Open Metadata and Governance (OMAG) Server-Plattform. Die OMAG-Server-Plattform hostet ein oder mehrere OMAG-Server. Aufgabe der OMAG-Server ist es, die Intelligenz, Konnektoren und Frameworks zur Anbindung der verschiedenen Datenplattformen an die verteilte OMAG-Server-Plattform zu managen. Jeder Typ von OMAG-Server ist für die Integration einer bestimmen Datenressource- oder -plattform vorgesehen. Egeria unterstützt für den Betrieb der OMAG-Server-Plattform Container- und Orchestrierungs-Technologien wie Docker und Kubernetes.

Vorteile von Egeria

Der Open-Source-Standard für Metadaten Egeria bietet zahlreiche Vorteile. Er vereinfacht das automatisierte Austauschen, Teilen, Synchronisieren und Managen von Metadaten unterschiedlicher Datenplattformen und -ressourcen. Durch die Bereitstellung offener Application Programming Interfaces (APIs), Frameworks, Protokolle, Konnektoren und Formate lassen sich Metadaten hersteller-, plattform- und toolunabhängig verwalten und kontrollieren. Anwendungen und Tools greifen transparent auf die Metadaten heterogener Datenstrukturen zu. Der manuelle Aufwand zur Verwaltung und Anpassung der Metadaten unterschiedlicher Plattformen wird minimiert. Weitere Vorteile von Egeria sind:

  • Egeria definiert ein offenes Metadaten-Standardschema für über 800 Metadaten-Typen
  • modular aufgebaut
  • einfach zu erweitern und an individuelle Anforderungen oder eigene Datenressourcen anzupassen
  • unterstützt Virtualisierungstechnologien wie die Container-Engine Docker und die Orchestrierung von Containern mit Kubernetes

(ID:47876258)