Der Schlüssel zu einer erfolgreichen Implementierung von Künstlicher Intelligenz (KI) liegt nicht nur in der Technologie selbst, sondern zunächst einmal in den zugrunde liegenden Daten. Insbesondere unstrukturierte Daten, die etwa 80 Prozent der Unternehmensinformationen ausmachen, bieten ein enormes Potenzial, um KI-Modelle zu trainieren. Viele Unternehmen haben jedoch noch Schwierigkeiten, diese heterogenen Daten effektiv zu verwalten und für KI-Anwendungen nutzbar zu machen.
Der Autor: Heinz Wietfeld ist Director bei Hyland
(Bild: Hyland)
Nehmen wir das Beispiel eines großen Einzelhändlers, der Kundenrezensionen aus verschiedenen Plattformen wie E-Mails, sozialen Medien und Online-Feedbackformularen sammelt. Diese unstrukturierten Daten in Form von Text, Bildern und Videos enthalten wertvolle Informationen über die Kundenzufriedenheit und die häufigsten Probleme mit bestimmten Produkten. Um diesen Datenschatz zu heben, müssen die Daten jedoch zunächst einmal analysiert, kategorisiert und zu handlungsrelevanten Erkenntnissen aufbereitet werden. Dann kann das Unternehmen nicht nur schnell auf Kundenfeedback reagieren, sondern auch Markttrends erkennen, die Produktentwicklung optimieren, das Kundenerlebnis insgesamt verbessern und operative Prozesse optimieren. Das Potenzial ist also groß, das Management dieser Daten jedoch ungleich schwieriger als das von strukturierten Daten.
Unstrukturierte Daten sind eine Herausforderung
Der Begriff „unstrukturierte Daten“ bezieht sich auf Informationen, die in keinem einheitlichen Format vorliegen und in herkömmlichen Datenbanken schwer zu verarbeiten sind. Beispiele hierfür sind die bereits genannten E-Mails, Bilder, Videos und Social-Media-Interaktionen aber auch, PDF-Dateien oder Präsentationen. Diese Daten sind zwar reich an Informationen, jedoch in einem unstrukturierten Zustand schwer zugänglich und nutzbar. Unternehmen stehen vor der Herausforderung, diese wertvollen Daten zu erschließen, da sie oft in unterschiedlichen Systemen und Datensilos gespeichert und nicht miteinander verbunden sind.
Wenn Unternehmen KI-Systeme entwickeln oder einsetzen, ist die Qualität der zugrunde liegenden Daten entscheidend. Ohne eine konsistente, qualitativ hochwertige Datenbasis sind die Ergebnisse von KI-Anwendungen möglicherweise verzerrt oder unvollständig. Unstrukturierte Daten enthalten viele der Informationen, die für Geschäftsprozesse entscheidend sind, wie etwa Kundeninteraktionen, Vertragsinhalte oder operative Abläufe. Diese Daten sind unverzichtbar, um KI-Systeme auf die spezifischen Anforderungen eines Unternehmens anzupassen und fundierte Entscheidungen zu ermöglichen.
Content Management – der Weg zu KI-Exzellenz
Die Fähigkeit, unstrukturierte Daten in wertvolle Erkenntnisse zu verwandeln, hängt von den eingesetzten Technologien ab. Enterprise-Content-Management-Systeme (ECM) und intelligente Content-Services bieten die Werkzeuge, um heterogene Daten zu erfassen, zu kategorisieren und für KI-Systeme zugänglich zu machen. Diese Lösungen können Daten aus verschiedenen Quellen konsolidieren und in strukturierte, nutzbare Formate überführen.
Ein Beispiel hierfür sind Technologien, die Inhalte automatisch scannen, analysieren und in einem zentralen System bzw. einer „Single-Source-of-Truth“ ablegen können. Single Source of Truth (SSoT) bedeutet, dass alle relevanten Daten eines Unternehmens zentral und konsistent an einem Ort gespeichert werden, um eine einheitliche, verlässliche Informationsquelle zu gewährleisten.
Dokumente, die früher isoliert in E-Mail-Postfächern oder auf persönlichen Laufwerken gespeichert wurden, werden in einem strukturierten Format über eine Plattform verfügbar gemacht. So erhalten Verantwortliche nicht nur einen umfassenden Überblick über ihre Daten, sondern legen gleichzeitig die Grundlage für den Einsatz von KI, indem sie die richtigen Daten für den richtigen Anwendungsfall bereitstellen. Diese Konsolidierung findet dabei nicht mehr auf einer monolithischen Plattform statt. Vielmehr werden die unterschiedlichen Repositories und Anwendungen über vorgefertigte und konfigurierbare Integrationen und Konnektoren miteinander verbunden. Das bietet insbesondere in Zeiten von hybriden und Cloud-Infrastrukturen maximale Flexibilität.
Was Unternehmen beachten sollten
Für den Erfolg einer KI-Strategie sind die folgenden Aspekte entscheidend:
1. Datenqualität und Konsistenz: Eine zuverlässige und konsistente Datenbasis ist das Fundament für KI-Anwendungen. Daten müssen bereinigt, aktualisiert und fehlerfrei sein, damit KI-Modelle die richtigen Schlüsse ziehen können. Unternehmen sollten in Prozesse investieren, die eine regelmäßige Datenpflege sicherstellen.
2. Datensilos aufbrechen: Eine der größten Herausforderungen bei der Arbeit mit unstrukturierten Daten ist die Fragmentierung. Daten aus verschiedenen Abteilungen oder Systemen müssen integriert werden, um eine umfassende und einheitliche Datenbasis zu schaffen. Das ermöglicht nicht nur eine vollständige Sicht auf die Unternehmensdaten, sondern auch eine bessere Zusammenarbeit zwischen verschiedenen Teams.
3. Sicherheits- und Datenschutzanforderungen: Mit der zunehmenden Menge an Daten wächst auch die Verantwortung, diese zu schützen. KI-Systeme arbeiten oft mit sensiblen Daten, wie z. B. Kundeninformationen oder Finanzdaten. Es ist daher unerlässlich, dass Unternehmen strenge Sicherheits- und Datenschutzrichtlinien befolgen. Intelligente Content-Lösungen können hier unterstützen, indem sie nicht nur die Datenverarbeitung optimieren, sondern auch Compliance- und Sicherheitsanforderungen berücksichtigen.
4. Kontinuierliche Datenpflege: Daten müssen regelmäßig aktualisiert werden, um sicherzustellen, dass sie für KI-Anwendungen weiterhin relevant und nützlich sind. Eine dynamische Datenstrategie, die auf die kontinuierliche Pflege und Verbesserung der Datenbasis setzt, ist unerlässlich für langfristigen Erfolg.
Die Zukunft der KI-gestützten Unternehmen
Indem Unternehmen unstrukturierte Daten mit modernen ECM-Systemen und intelligenten Content-Lösungen erschließen, schaffen sie die Grundlage für eine erfolgreiche KI-Implementierung. KI-Systeme, die mit qualitativ hochwertigen, umfassenden Daten arbeiten, liefern präzisere und relevantere Ergebnisse. Dies bedeutet, dass Unternehmen nicht nur effizienter arbeiten können, sondern auch ihre Innovationskraft und Wettbewerbsfähigkeit steigern, Prozesse optimieren, Kunden besser verstehen und neue Geschäftsmodelle und Business Opportunities erschließen können. Die Kombination aus strukturierten und unstrukturierten Daten schafft eine solide Basis, auf der Unternehmen fundierte Entscheidungen treffen und KI-Lösungen entwickeln können, die ihre spezifischen Anforderungen erfüllen.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Fazit: Die Bedeutung unstrukturierter Daten kann gar nicht hoch genug bewertet werden – nicht zuletzt, weil durch Social Media und Self-Service-Angebote Verbraucher, Kunden und Anwender selbst enorme Datenmengen produzieren, die wertvollen Mehrwert und Business Insights liefern. Will man das volle Potenzial von KI nutzen, sind sie unverzichtbar. Moderne ECM- und Content-Services-Lösungen helfen dabei, diese Daten zu strukturieren und nutzbar zu machen. Unternehmen, die diese Technologien erfolgreich einsetzen, schaffen eine solide Grundlage für ihre KI-Strategie und setzen sich an die Spitze des technologischen Fortschritts. Die Zukunft gehört denen, die ihre Daten – egal ob strukturiert oder unstrukturiert – intelligent nutzen.