Kommentar von Dr. Karsten Konrad, Roll & Pastuch Warum KI gute Referenzdaten braucht

Von Dr. Karsten Konrad 4 min Lesedauer

Anbieter zum Thema

In den vergangenen zwei Jahrzehnten zeigt sich ein deutlich positiver Trend in der Business Intelligence: Unternehmen verbessern kontinuierlich ihr Management von Massendaten. Trotz intensiver Bemühungen zeigt sich jedoch, dass viele vermeintlich „einfache“ Analysen auf Grundlage vorhandener Geschäftsdaten weder einfach noch zeitnah durchführbar sind.

Der Autor: Dr. Karsten Konrad ist Senior Director Data Science bei der Unternehmensberatung für Preismanagement und Vertrieb Prof. Roll & Pastuch – Management Consultants.(Bild:  Prof. Roll & Pastuch – Management Consultants)
Der Autor: Dr. Karsten Konrad ist Senior Director Data Science bei der Unternehmensberatung für Preismanagement und Vertrieb Prof. Roll & Pastuch – Management Consultants.
(Bild: Prof. Roll & Pastuch – Management Consultants)

Einige Beispiele aus unserer Beratungspraxis verdeutlichen diese Herausforderungen: Ein Produktionsunternehmen macht klare Unterschiede in der Preisgestaltung zwischen „Projektgeschäft“ und „Standardgeschäft“. Jedoch fehlt sowohl eine Definition dessen, was ein Projekt charakterisiert, als auch eine Zuordnung in den Transaktionsdaten, die erkennen lässt, zu welcher Kategorie ein verbuchter Umsatz gehört. Im Rahmen einer strategischen Neuausrichtung eines Unternehmens sollen Standardkunden im Vergleich zu internationalen Key-Accounts preislich bevorzugt werden. Die dafür erforderliche Klassifizierung der Kunden ist jedoch unvollständig oder mehrdeutig, ebenso wie die Konzernstrukturen der Großkunden.

So soll beispielsweise bei einem Maschinenbauunternehmen die Preisgestaltung von Ersatzteilen davon abhängen, ob es sich um Standard-Ersatzteile oder Verschleißteile handelt. Obgleich die Maschinen überwiegend vom Hersteller gewartet werden, lässt sich eine notwendige Segmentierung der Ersatzteile lediglich indirekt über Verkaufsfrequenzen ableiten.

Die wahren Hemmnisse bei strategischen Analysen sind dabei weniger die umfangreichen „großen Daten“ wie Transaktionsdaten aus Verkäufen oder Logistik. Vielmehr sind es die „kleinen Daten“ – jenseits der herkömmlichen, einmalig anzulegenden Stammdaten – die vielen Unternehmen Schwierigkeiten bereiten. Diese Referenzdaten, die essenzielle und veränderliche Verbindungen zwischen Geschäftsobjekten darstellen, bilden nur einen geringen Anteil der gesamten Daten, die ein Unternehmen verwaltet.

Der Grund, warum Referenzdaten nicht von der beobachteten Qualitätssteigerung anderer Datenkategorien profitieren, ist relativ einfach: Die Pflege dieser „Slowly Changing Dimensions“ erfordert kontinuierliche Aufmerksamkeit von menschlichen Experten, um Aktualität und Qualität zu gewährleisten. Bei vielen dieser Daten lässt das Interesse allerdings im Laufe der Zeit nach, sofern sie nicht die Basis für kritische Kennzahlen des (Top-)Managements bilden. Zum Beispiel wird ein Vertriebsmitarbeiter, der im CRM-System Gründe für verlorene Angebote dokumentieren soll, dies nur so lange akribisch tun, wie er davon überzeugt ist, dass diese Informationen tatsächlich sinnvoll genutzt werden.

Dreamteam – KI und gute Referenzdaten

Mit der zunehmenden Verbreitung von Künstlicher Intelligenz (KI) in den vergangenen Jahren steigt die Bedeutung von Referenzdaten weiter an. Maschinelle Lernverfahren, die aus Daten Erkenntnisse gewinnen, sind nicht in der Lage, das erforderliche Domänenwissen ausschließlich aus vorhandenen Geschäftsdaten zu generieren. Daher ist Künstliche Intelligenz auf qualitativ hochwertige Referenzdaten angewiesen, um präzise Vorhersagen treffen zu können.

Ein Beispiel für die Anwendung maschinellen Lernens ist die Preisoptimierung durch die Vorhersage von Preiselastizitäten. Das Fundament für die hierfür benötigten Daten bilden Bestellzeilen der Kunden mit Angaben wie Produkt-ID, Menge und Preis. Jedoch sind für die Effektivität der mittels KI erstellten Modelle zusätzliche externe Domäneninformationen erforderlich, die als Referenzdaten bereitgestellt werden müssen. In Bezug auf den elektronischen Handel könnten dies zum Beispiel sein:

  • Informationen zu Produktfamilien, die homogene oder austauschbare Produktgruppen definieren
  • Nachfragefaktoren in verschiedenen Regionen, wie beispielsweise Feiertage und typische Urlaubsmonate
  • spezifische Marktbedingungen, wie Produktneueinführungen oder Werbeaktionen der Konkurrenz
  • Fehler oder Lücken in den Referenzdaten haben früher meist nur zu zusätzlichem Aufwand in der Analyse geführt. Heute jedoch können Mängel in den Referenzdaten vor allem die Digitalisierung kritischer Geschäftsprozesse behindern. Für viele Unternehmen bedeutet dies einen erheblichen Wettbewerbsnachteil, sollten sie das Management von Referenzdaten weiterhin vernachlässigen.

Priorisieren und automatisch Generieren

Unternehmen können oft relativ einfach die ihnen derzeit noch fehlenden Daten identifizieren. Allerdings resultiert dieser Prozess häufig in einer überraschend langen Liste, die selbst in einem ambitionierten Projekt zunächst nicht gänzlich bearbeitet werden kann. Zur optimalen Steuerung einer Referenzdateninitiative bietet sich folgendes Vorgehen an:

  • Ein initialer Workshop mit Vertretern verschiedener Fachabteilungen sollte die Basis aller Entscheidungen sein, um eine konsolidierte Longlist für die Dateninitiative zu entwickeln. Die teilnehmenden Fachabteilungen benötigen einen erkennbaren Nutzen, um ausreichend motiviert an der späteren Mitarbeit zu sein.
  • Kurzfristig sollten zunächst jene Referenzdaten hoch priorisiert werden, die für entscheidungsrelevante, häufig benötigte und zeitkritische Analysen grundlegend sind. Beinahe immer sind die zunächst Daten zu Märkten und Kunden wie z. B. Potenziale, Beziehungen zwischen Unternehmen und Brancheninformationen der Kunden.
  • Mittelfristig können Referenzdaten entwickelt werden, die zur besseren Automatisierung von Geschäftsprozessen beitragen. Hier besteht oft etwas mehr Zeit, da die Infrastruktur für die Automatisierung meist noch nicht vorhanden ist.
  • Vermeiden sollte man Referenzdaten, deren Nutzen im Vergleich zum Pflegeaufwand hoch ist. „Low Hanging Fruits“, die mit geringem oder keinem Aufwand realisiert werden können, sollten als Nebenprodukt einer größeren Dateninitiative mitgenommen werden.

Auch wenn sich sicher Informationen finden, die frei verfügbar sind oder zugekauft werden können, muss damit gerechnet werden, dass die Experten der Fachabteilungen initial Energie und Zeit in das Sammeln der Daten einbringen müssen. Aufgrund der weitverbreiteten Verfügbarkeit maschineller Lernverfahren sind Unternehmen allerdings heute in der Lage, diese Techniken zur effizienteren Generierung von Referenzdaten einzusetzen.

Zum Beispiel ist bei einer fehlenden Produktsegmentierung nicht zwingend erforderlich, wie früher alle Produkte manuell zu klassifizieren. Stattdessen können menschliche Experten einen Teil der Produkte segmentieren und die daraus gewonnenen Erkenntnisse mittels Klassifikationsverfahren anwenden, um die restlichen Produkte automatisiert zu klassifizieren. Ähnlich lassen sich bestehende Produkt- und Kundenhierarchien durch Data Mining in übersichtlichere Cluster umwandeln, die als Stammdaten im Data Warehouse die Analyse erleichtern. Low-Code-Plattformen wie KNIME, Rapid Miner oder Orange ermöglichen es den „Citizen Data Scientists“ in Unternehmen, mit vergleichsweise geringem Aufwand die heute noch bestehenden Datenlücken zumindest in Teilen zu schließen.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Artikelfiles und Artikellinks

(ID:49870107)