Entwicklung der Pusan National University Algorithmus stellt fehlende Daten in Event Logs wieder her

Von Martin Hensel

Die Wissenschaftler der südkoreanischen Pusan National University haben einen neuartigen Algorithmus entwickelt, der fehlende Daten in Event Logs mit höchster Genauigkeit reparieren kann. Er könnte in künftigen KI-Anwendungen zum Einsatz kommen.

Anbieter zum Thema

Das Verfahren der Wissenschaftler erzielt um bis zu 30 Prozent bessere Ergebnisse als bisherige Methoden.
Das Verfahren der Wissenschaftler erzielt um bis zu 30 Prozent bessere Ergebnisse als bisherige Methoden.
(Bild: Pusan National University)

Im Zuge der Digitalisierung dokumentieren Unternehmen ihre Vorgänge im Rahmen von Event Logs. Dabei werden Aktivitäten in Geschäftsprozessen aufgezeichnet und mit Attributen wie etwa Zeitstempeln oder Ereignisbezeichnungen versehen. Derartige Logs geben einen Überblick über alle Vorgänge und ermöglichen zudem die Entwicklung von KI-Modellen zur Prozessoptimierung. Letztere ist allerdings nur so gut wie die verfügbaren Daten. Fehlen Ereignisdaten in Logs, sind unzureichende Analysen und Datenmodelle die Folge.

Lückenhafte Daten vervollständigen

Im Rahmen einer gemeinsamen Studie haben Wissenschaftler der Pusan National University aus Südkorea und des Georgia Institute of Technology eine Methode entwickelt, um fehlende Daten in einem Event Log wiederherzustellen. Das Verfahren nutzt dazu Imputationsmethoden, die auf Korrelationen mit verfügbaren Daten basieren.

„Da Daten in unterschiedlichen Systemen aus verschiedenen Blickwinkeln erfasst werden, sind Beziehungen zwischen den Daten vorhanden“, erklärt Dr. Sunghyun Sim. „Auf dieser Basis entwickelten wir eine Methode zur Wiederstellung fehlender Ereigniswerte, indem wir die Beziehungen zwischen Entitäten im Event Log nutzen. Somit lassen sich menschliches Versagen oder Systemfehler überwinden“, ergänzt er.

Funktionsweise im Detail

In Event Logs sind Attribute von Ereignissen mit anderen Ereignissen in „Single Event“- oder „Multiple Event“-Beziehungen verknüpft. Bei „Single Event“-Beziehung entspricht jedes Attribut eines Ereignisses einem eindeutigen Attribut eines anderen Ereignisses. Dies machten sich die Wissenschaftler zunutze: Sie entwickelten eine Methode der systematischen Ereignis-Imputation (SEI). Sie stellt einen fehlenden Wert wieder her, indem sie sich auf die entsprechend verknüpfte Information bezieht.

Bei „Multiple Event“-Beziehung ist dieser einfache Abgleich der Attribute aber nicht möglich. Stattdessen entwickelten die Forscher eine weitere Methode zur Imputation mehrerer Ereignisse („Multiple Event Imputation“, MEI). Bei diesem Verfahren werden fehlende Ereignisse zunächst geschätzt und dann zur Erstellung von Event-Sequenzen oder Event-Ketten genutzt. Diese lassen sich mit einem vollständigen Event Log vergleichen, um fehlende Attribute wiederherzustellen. Die beiden Verfahren werden durch einen ein Bagging-Recurrent-Event-Imputation-Algorithmus (BREI) gleichzeitig eingesetzt. Hierbei kommen Bootstrap-Sampling und Recurring Event Impution (REI) zum Einsatz.

Im Vergleich mit bestehenden Verfahren konnten die südkoreanischen Wissenschaftler die Wiederherstellungsgenauigkeit um 10 bis 30 Prozent verbessern. Zudem konnten knapp 90 Prozent der Daten wiederhergestellt werden, selbst wenn von ihnen mehr als die Hälfte fehlte. Die Wissenschaftler hoffen, dass der Algorithmus dank seiner hohen Genauigkeit künftig weite Verbreitung in der Industrie findet.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

(ID:47943925)