KI-Nutzung von Webinhalten Cloudflare führt „Content Signals“ gegen ungewolltes KI-Training ein

Von Berk Kutsal 1 min Lesedauer

Anbieter zum Thema

Mit einer neuen Richtlinie erlaubt Cloudflare Website-Betreibern, KI-Systemen klare Grenzen zu setzen. Die „Content Signals Policy“ legt fest, ob und wie Inhalte für Training oder Inferenz genutzt werden dürfen.

Cloudflare führt mit Content Signals eine neue Richtlinie ein, mit der Webseiten festlegen können, ob ihre Inhalte für KI-Training oder Inferenz genutzt werden dürfen.(Bild:  Cloudfare)
Cloudflare führt mit Content Signals eine neue Richtlinie ein, mit der Webseiten festlegen können, ob ihre Inhalte für KI-Training oder Inferenz genutzt werden dürfen.
(Bild: Cloudfare)

Cloudflare hat eine Richtlinie vorgestellt, mit der Betreiber von Webseiten festlegen können, wie ihre Inhalte von Künstlicher Intelligenz verwendet werden dürfen. Die sogenannte Content Signals Policy erweitert das bekannte robots.txt-Format um neue Anweisungen, die auch das Training und die Nutzung von KI-Modellen adressieren.

Präferenz statt Verbot

Die neue Policy ermögliche es, maschinenlesbare Hinweise in der robots.txt zu hinterlegen. Drei Kategorien sind vorgesehen:

  • search – für die Indexierung in Suchmaschinen,
  • ai-input – für die Nutzung in KI-Inferenzprozessen,
  • ai-train – für den Einsatz im Modelltraining.

Ein Beispiel lautet:

# search=yes, ai-train=no

Damit wird die Indexierung durch Suchmaschinen erlaubt, das Training von KI-Systemen aber untersagt. Cloudflare weist darauf hin, dass die Signale keine technischen Barrieren darstellen, sondern als rechtlich relevante Präferenzaussagen fungieren sollen.

Zwischen Offenheit und Kontrolle

Mit der Initiative reagiert Cloudflare auf das Spannungsfeld zwischen Offenheit im Web und dem Schutz geistiger Arbeit. Viele Betreiber sehen sich gezwungen, Inhalte hinter Logins zu verstecken, um automatisiertes Scraping zu verhindern – mit negativen Folgen für Reichweite und Sichtbarkeit.

Kunden, die Cloudflare für das Management ihrer robots.txt nutzen, erhalten die neuen Signale automatisch. Für andere stellt das Unternehmen Vorlagen bereit. Die Richtlinie steht unter einer CC0-Lizenz und soll in internationalen Standardisierungsgremien weiterentwickelt werden.

Ein rechtlich bindender Schutz ist mit der Policy allerdings nicht verbunden. Sie schaffe keine technische Blockade, sondern kommuniziere Absichten – in der Hoffnung, dass KI-Unternehmen sie respektieren.

(ID:50586870)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung