Kommentar von Thomas Steur, MatomoAI Dark Traffic und Privacy First Analytics – Datenqualität wird zur strategischen Kernfrage
Von
Thomas Steur
4 min Lesedauer
Die Webanalyse gilt in vielen Unternehmen als Fundament für datengetriebene Entscheidungen. Budgetallokation, Kampagnensteuerung, Produktoptimierung – all das basiert auf Metriken wie der Conversion Rate, der Engagement-Tiefe oder auf Attributionsmodellen. Diese Modelle setzen jedoch voraus, dass die gemessenen Interaktionen von menschlichen Nutzern stammen und deren Verhalten valide abbilden. Genau diese Annahme gerät durch den Aufstieg generativer Künstlicher Intelligenz (KI) unter Druck – und das schneller, als viele Datenstrategen wahrhaben wollen.
Der Autor: Thomas Steur ist CTO von Matomo, einer global agierenden Open-Source-Analytics-Plattform mit Fokus auf Datenschutz, Compliance, Kontrolle und europäische Datensouveränität.
(Bild: Matomo)
Ein wachsender Anteil des Web-Traffics wird heute von automatisierten Systemen erzeugt. Neben den klassischen Bots sind es zunehmend LLM-Crawler, RAG-basierte Scraper sowie autonome KI-Agenten, die mit Webseiten interagieren.
Diese Systeme erzeugen zwei zentrale Problemklassen:
Phantom-Signale: Automatisierte Zugriffe, die in Analytics-Systemen fälschlicherweise als Interaktionen menschlicher Nutzer erscheinen. Sie sind zwar sichtbar, aber irreführend.
Dark Traffic: Damit sind KI-getriebene Aktivitäten gemeint, die klassische Tracking-Mechanismen gar nicht oder nur unvollständig erfassen. Sie bieten relevante Einblicke in die Nutzung einer Website durch KI, bleiben aber unsichtbar.
Hinzu kommt ein struktureller Wandel im Nutzerverhalten: Zero-Click-Interaktionen nehmen zu. Informationen werden direkt über KI-Systeme konsumiert, ohne dass die Ursprungswebsite besucht wird. Die Folge: Sichtbare Daten verlieren an Aussagekraft, während unsichtbare Daten an Einfluss gewinnen.
Wie KI-Traffic klassische Enterprise-Metriken verzerrt
Die Auswirkungen sind zwar subtil, aber systematisch. Dabei betreffen sie nicht nur Marketing-Analytics, sondern jede Datenschicht, die auf Web-Events aufbaut: von BI-Dashboards über ML-Trainingssets bis hin zu Customer-Behaviour-Modellen in CRM-Systemen.
Conversion Rates werden infolgedessen schwer interpretierbar. In manchen Fällen sinken sie durch nicht konvertierende Bot-Sessions. Oft bleiben sie auch gleich, während der Website-Traffic schrumpft. Dieses Verhalten wird besonders dann sichtbar, wenn Nutzer zur Produktrecherche und Entscheidungsfindung KI-Chatbots nutzen und erst zur tatsächlichen Transaktion die eigentliche Website besuchen. Die User-Journey verlagert sich und findet zu einem großen Teil außerhalb der Website statt.
Engagement-Metriken wie Verweildauer oder Seiten pro Sitzung erodieren, weil automatisierte Systeme Inhalte ohne tatsächliche Rezeption abrufen. Attributionsmodelle verlieren an Präzision, weil Traffic ohne Kampagnenkontext entsteht oder bestehende Touchpoints vollständig umgangen werden.
Das Tückische dabei ist, dass diese Verzerrungen selten als offensichtliche Ausreißer auftreten. Sie bleiben unsichtbar oder manifestieren sich maximal als graduelle Verschiebungen über mehrere Kennzahlen hinweg. Unternehmerische Entscheidungen, die auf dieser Datengrundlage getroffen werden, mögen zwar rational wirken, sind es aber nicht.
Warum klassische Bot-Erkennung versagt
Frühere Bots ließen sich vergleichsweise einfach identifizieren, beispielsweise über User-Agent-Filter oder IP-Blacklists. Moderne KI-Systeme funktionieren jedoch anders. Manche Systeme führen kein JavaScript aus und entziehen sich klassischen Erkennungsmechanismen komplett. Andere nutzen vollständige Browserumgebungen und simulieren komplexe, menschenähnliche Navigationspfade. Damit entziehen sie sich sowohl regelbasierten Filtern als auch klassischen Bot-Erkennungsdiensten, die auf Musterbibliotheken bekannter Crawler setzen.
Eine Reaktion auf diese Entwicklung könnte sein, invasiver zu tracken, um nicht-menschlichen Websitebesuchern so auf die Schliche zu kommen. Invasive Tracking-Ansätze geraten allerdings zunehmend unter regulatorischen Druck. DSGVO-Compliance, ePrivacy-Vorgaben und die wachsende Ablehnung von Third-Party-Cookies schaffen ein Spannungsfeld. Wenn klassische Methoden versagen und invasives Tracking zu Konflikten führt – wie gelangen Teams dann zu belastbaren Daten?
Architekturentscheidungen für robuste Daten
Das Ziel ist nicht die vollständige Eliminierung von Bot-Traffic – das ist heutzutage unrealistisch. Die eigentliche Aufgabe besteht vielmehr darin, belastbare Entscheidungsgrundlagen zu schaffen.
Dazu müssen Teams nicht nur die Datenarchitektur, sondern auch Governance und Tracking-Methoden anpassen:
Trennung von Rohdaten und Entscheidungsmetriken: Rohdaten sollten vollständig erfasst, aber klar von kuratierten, entscheidungsrelevanten Metriken getrennt werden. Letztere beruhen auf qualifizierten Interaktionen und nicht auf Gesamtsichtbarkeit. Diese Trennung ist eine Governance-Entscheidung.
Einführung von Meaningful Sessions: Anstatt jede Session gleich zu gewichten, werden Interaktionen idealerweise anhand definierter Kriterien bewertet – etwa Feature-Nutzung, konsistente Navigationspfade oder transaktionale Signale. Dieser Ansatz ist aus der Produktanalytik bekannt und lässt sich auf Web-Analytics übertragen.
Verhaltensbasierte Signalvalidierung: Anstelle nur zwischen Mensch und Maschine zu differenzieren, wird die Plausibilität von Nutzungsmustern betrachtet: Timing-Strukturen, Wiederholungsmuster, Einstiegsanomalien. Diese Methoden sind robuster gegen die Mimikry-Methoden moderner KI-Systeme.
First-Party-Analytics und serverseitiges Tracking: Clientseitige Tracking-Skripte erfassen automatisierten Systeme nur unzureichend. Serverseitige Event-Architekturen, ergänzt durch dedizierte Erkennungsmechanismen für KI-Agenten – etwa über spezifische HTTP-Header oder Verhaltens-Fingerprinting –, schaffen Transparenz für bislang unsichtbaren Dark Traffic.
Organisationsübergreifende Data Governance: Die Datenqualität ist keine rein technische Aufgabe. Abteilungen aus den Unternehmensbereichen Marketing, Produkt, Data Engineering und Analytics sollten die Verantwortung dafür teilen. Auffälligkeiten müssen kontextualisiert, Annahmen explizit gemacht und regelmäßig hinterfragt werden.
Der Privacy-First-Ansatz als Qualitätsprinzip – nicht nur als Compliance-Pflicht
In diesem Kontext gewinnt das oft missverstandene Prinzip „Privacy First“ an strategischer Bedeutung. Ein häufiger Einwand lautet, Datenschutz gehe auf Kosten der Datenqualität. Die Praxis beweist das Gegenteil. Weniger, aber präziser gesetzte Datenpunkte erzeugen weniger Rauschen. Wer seine Datenerhebung auf echte Entscheidungsrelevanz ausrichtet, erhält Signale, die auch in einer zunehmend automatisierten Web-Umgebung stabil bleiben. Ein Beispiel: Unternehmen, die bereits auf Cookieless Tracking mit First-Party-Events umgestellt haben, profitieren von deutlich konsistenteren Conversion-Metriken – weil sie das Bot-Rauschen aus dem Third-Party-Ökosystem nie mitgemessen haben.
Datenschutz ist somit kein Gegenspieler zu validen Daten. Er ist eine Voraussetzung. Organisationen, die ihre Datenerhebung konsequent an Privacy-First-Prinzipien ausrichten, schaffen nicht nur regulatorische Compliance, sondern auch robustere Entscheidungsgrundlagen. In einer Umgebung zunehmender Signalverzerrung wird Datenintegrität damit zu einem messbaren Wettbewerbsvorteil.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Fazit: Von der Datenmenge zur Datenqualität
Mit der Verbreitung generativer KI verschiebt sich die zentrale Fragestellung. Entscheidend ist nicht mehr die Frage „Wie viel messen wir?“, sondern „Was davon ist entscheidungsrelevant?“. Nicht jeder Besuch steht nun für einen Nutzer – und nicht jede relevante Interaktion wird überhaupt sichtbar. Unternehmen, die weiterhin auf unveränderte, konventionelle Metriken und Modelle vertrauen, riskieren Fehlinterpretationen mit direkten Auswirkungen auf Strategie, Budgetverteilung und die Qualität der Modelle selbst.
Die Lösung liegt nicht in invasiveren Tracking-Mechanismen. Sie liegt im Paradigmenwechsel: Der Fokus sollte darauf liegen, präzise zu messen und gezielt zu verstehen, was geschieht – mit einem Privacy-First-Ansatz als übergeordnetem Qualitätsprinzip.
Analytics bleibt letztlich ein leistungsfähiges Instrument zur Entscheidungsfindung – aber nur für jene Organisationen, die bereit sind, ihren Umgang mit Daten grundlegend neu zu denken.