Studie: KI-Chatbots liefern nur 0,27 Prozent des Traffics - Sperren empfohlen - ContentConsultants

Eine Analyse der Define Media Group stellt den wirtschaftlichen Nutzen von KI-Chatbots für Publisher infrage. Trotz der rasanten Verbreitung von ChatGPT, Perplexity und anderen Large Language Models (LLMs) entfielen laut Similarweb im April 2026 lediglich 0,27 Prozent des gesamten Traffics der US-amerikanischen News- und Medienbranche auf generative KI.

Nach Angaben der Autoren nutzen inzwischen rund 100 Millionen Menschen in den USA regelmäßig KI-Chatbots. Dennoch würden die Systeme kaum Besucher an die ursprünglichen Quellen weiterleiten. Stattdessen verbleiben Nutzer innerhalb der jeweiligen KI-Plattformen, wodurch Verlage nur in geringem Umfang von der wachsenden Nutzung profitieren.

Inhalt

Verlage sollten Bots standardmäßig blockieren

Define Media Group empfiehlt Publishern eine Strategie nach dem Prinzip „Block by Default, Allow by Agreement“. KI-Crawler sollen demnach grundsätzlich gesperrt werden, sofern keine vertraglichen Vereinbarungen oder wirtschaftlichen Vorteile bestehen. Als Vorbilder nennt der Bericht unter anderem The Atlantic und People Inc., die bereits umfangreiche Bot-Blockaden umgesetzt haben.

Laut den Autoren reichen Einträge in der robots.txt-Datei nicht mehr aus. Viele KI-Crawler würden Sperranweisungen ignorieren oder technische Maßnahmen nutzen, um ihre Identität zu verschleiern. Genannt werden unter anderem Browser-Imitationen, wechselnde IP-Adressen und rotierende Netzwerke.

Sorge vor zunehmenden Zugriffen auf Paywall-Inhalte

Besonders kritisch bewertet die Studie spezialisierte Crawling-Dienste wie Exa, Firecrawl oder Tavily. Diese würden Inhalte teilweise auch dann erfassen, wenn bekannte KI-Bots bereits blockiert seien. In einem dokumentierten Fall konnte ein Dienst laut Define Media Group einen vollständigen, hinter einer Paywall liegenden Artikel innerhalb von 0,19 Sekunden abrufen.

Content Strategie für nachhaltige Sichtbarkeit im KI-Zeitalter

Von Themenstrategie und Keywordrecherche über fundierte Fachartikel bis zur laufenden Optimierung bestehender Inhalte: Wir setzen den gesamten SEO-Prozess strukturiert um und entwickeln KI-Systeme mit menschlicher Qualitätskontrolle.

Lassen Sie Ihre Website jetzt überprüfen und bereiten Sie sich aufs KI-Zeitalter vor!

Erstgespräch mit Potenzialanalyse vereinbaren

Die Autoren warnen deshalb vor erheblichen Verlusten bei exklusiven Inhalten und empfehlen regelmäßige Audits, um bislang unbekannte Crawler zu identifizieren.

Google AI Overviews führen laut Analyse zu fast 50 Prozent weniger Klicks

Zusätzlich sieht die Define Media Group Risiken durch die zunehmende Integration generativer KI in die Google-Suche. Seit Einführung der AI Overviews seien die Klicks innerhalb des untersuchten Publisher-Netzwerks um 49 Prozent zurückgegangen. Gleichzeitig stammen laut Similarweb weiterhin rund 23 Prozent des Traffics der Nachrichtenbranche aus Suchmaschinen.

INSERT_STEADY_NEWSLETTER_SIGNUP_HERE

*Quelle: Similarweb, News and Media Industry Marketing Channels, US, April 2026* (via definemg.com)

Sollte Google den Übergang von der klassischen Suchmaschine zu einer KI-basierten Antwortplattform weiter vorantreiben, könnten die Besucherzahlen von Publishern nach Einschätzung der Autoren noch stärker sinken. Langfristig müsse daher sogar die Frage diskutiert werden, ob Verlage Googlebot weiterhin uneingeschränkten Zugriff auf ihre Inhalte gewähren sollten.

Bot-Traffic überholt menschliche Nutzer

Laut Daten von Cloudflare hat automatisierter Bot-Traffic inzwischen den menschlichen Datenverkehr im Internet überholt. Mit der Verbreitung autonomer KI-Agenten dürfte dieser Anteil weiter steigen.

Define Media Group fordert daher eine stärkere Zusammenarbeit der Verlagsbranche. Publisher sollten technische Schutzmaßnahmen etablieren, den Zugriff von KI-Unternehmen kontrollieren und Lizenzmodelle entwickeln, um für die Nutzung ihrer Inhalte eine angemessene Vergütung zu erhalten.

KI-Bots sperren: Von robots.txt bis zur Netzwerkebene

Die klassische Methode zur Steuerung von Webcrawlern ist die robots.txt-Datei. Betreiber können dort festlegen, welche Bereiche einer Website von bestimmten Bots besucht werden dürfen und welche nicht. Viele KI-Unternehmen veröffentlichen inzwischen eigene User-Agents, die sich gezielt sperren lassen.

Beispiele sind:

Sie möchten eine kurze Einschätzung zur SEO-Performance Ihrer Website?
Schreiben Sie mich einfach an und nennen Sie mir die aktuellen Herausforderungen.

KONTAKT

GPTBot (OpenAI)
ClaudeBot (Anthropic)
Google-Extended (Google Gemini)
PerplexityBot
Bytespider (ByteDance)
CCBot (Common Crawl)

Eine typische robots.txt-Regel sieht folgendermaßen aus:

User-agent: GPTBot
Disallow: /

User-agent: ClaudeBot
Disallow: /

Das Problem: Die robots.txt ist rechtlich und technisch lediglich eine freiwillige Verhaltensregel. Bots können die Vorgaben einfach ignorieren. Deshalb setzen viele Publisher inzwischen auf mehrstufige Schutzsysteme.

Firewall- und CDN-Sperren

Anbieter wie Cloudflare, Akamai, Fastly oder DataDome analysieren Zugriffe auf Netzwerkebene. Verdächtige Bots werden bereits vor dem Abruf der Website blockiert.

Dabei kommen verschiedene Verfahren zum Einsatz:

Erkennung bekannter Bot-IP-Adressen
Analyse von Browser-Fingerprints
Verhaltensanalysen
Rate Limiting bei ungewöhnlich vielen Anfragen
Captcha-Abfragen
JavaScript-Challenges

Der Vorteil besteht darin, dass auch Bots erkannt werden können, die sich als normale Browser ausgeben.

Signierte Zugriffe und Bot-Verifizierung

Cloudflare unterstützt inzwischen Verfahren zur kryptographischen Bot-Verifizierung. Dabei müssen Bots nachweisen, dass sie tatsächlich vom angegebenen Unternehmen stammen. Das soll verhindern, dass unbekannte Crawler bekannte User-Agents wie Googlebot oder GPTBot imitieren.

Schutz von Paywall-Inhalten

Besonders wertvolle Inhalte werden zunehmend serverseitig geschützt.

Dazu gehören:

serverseitige Paywalls statt JavaScript-Paywalls
Zugriff nur nach Login
Token-basierte Freigaben
dynamische Auslieferung von Inhalten
API-basierte Zugriffsmodelle

Diese Maßnahmen erschweren das automatisierte Auslesen kompletter Artikel erheblich.

Lizenzierung statt Komplettsperre

Einige Verlage verfolgen inzwischen einen anderen Ansatz. Statt alle KI-Crawler auszusperren, werden einzelne Anbieter gegen Lizenzgebühren zugelassen. So hat der Springer Verlag 2023 eine Zusammenarbeit mit ChatGPT vereinbart. Ob dies aber den massiven Rückgang des Traffics durch KI-Antworten ausgleichen kann, darf bezweifelt werden. Dennoch verfolgen einige große Verlage, Zugriffe technisch kontrollierbar zu machen und gleichzeitig neue Einnahmequellen über Kooperationen mit den großen KI-Anbietern zu schaffen.

Deutsche und europäische Rechtslage

Mit der DSM-Richtlinie (EU 2019/790) hat die Europäische Union vor dem Aufkommen der KI-Chatbots spezielle Regeln für Text- und Data-Mining eingeführt. Diese Regelung unterläuft nun den Schutz des Urheberrechts für Publisher. Artikel 4 erlaubt grundsätzlich das automatisierte Auslesen öffentlich zugänglicher Inhalte durch Unternehmen und KI-Anbieter.

Allerdings enthält die Richtlinie ein sogenanntes “Opt-out”-Recht. Rechteinhaber können maschinenlesbar erklären, dass ihre Inhalte nicht für Text- und Data-Mining verwendet werden dürfen. Während robots.txt technisch keine Sperre darstellt, kann sie in Europa als dokumentierter Widerspruch gegen die Nutzung von Inhalten für KI-Training interpretiert werden. Sobald die KI-Anbieter die robots.txt umgehen, haben Anbieter eine rechtliche Handhabe gegen das Scraping ihrer Inhalte.

EU AI Act erhöht den Druck auf KI-Anbieter

Zusätzliche Bedeutung erhält das Thema durch den EU AI Act.

Für General-Purpose-AI-Modelle gelten künftig Transparenzpflichten hinsichtlich:

verwendeter Trainingsdaten
Urheberrechts-Compliance
Umgang mit Rechteinhaber-Vorbehalten

Anbieter müssen nachweisen können, wie sie urheberrechtliche Anforderungen berücksichtigen. Für Publisher könnte dies die Durchsetzung von Opt-out-Erklärungen künftig erleichtern.

Rechtslage bleibt in vielen Punkten ungeklärt

Trotz der neuen Regelungen laufen weltweit zahlreiche Verfahren gegen OpenAI, Google, Meta, Anthropic und andere KI-Anbieter. In Deutschland hat das Landgericht München gerade geurteilt, dass Google für seine KI-generierten Antworten in der Suche auch haften muss. Das ist ein wegweisendes Urteil, weil es die KI-Anbieter in Haftung nimmt. Bei der hohen Fehlerquote in KI-Antworten könnte das sehr teuer werden.

Weitere Fragen sind bislang völlig ungeklärt:

Reicht eine robots.txt als wirksamer Nutzungsvorbehalt aus?
Dürfen bereits erstellte Trainingsdatensätze weiter genutzt werden?
Wann liegt eine urheberrechtlich relevante Vervielfältigung vor?
Welche Vergütungsansprüche können Publisher geltend machen?
Wie werden gesetzliche Vorgaben künftig kontrolliert?

Mit ersten Grundsatzurteilen wird in den kommenden Jahren gerechnet. Bis dahin setzen viele Verlage auf eine Kombination aus technischen Sperren, vertraglichen Lizenzmodellen und urheberrechtlichen Vorbehalten.