KI-Sichtbarkeit messen: Was die Daten über LLM-Zitationen wirklich sagen

LLM-Zitationen gelten derzeit als neue Kennzahl im Umfeld von Generative Engine Optimization (GEO). Zahlreiche neue Tools versprechen, die „Sichtbarkeit in ChatGPT“ oder anderen KI-Systemen messbar zu machen. Im Mittelpunkt steht dabei meist eine einfache Frage: Wird eine Marke oder Website in generierten Antworten erwähnt?

Um diese Kennzahl einordnen zu können, muss zunächst verstanden werden, wo solche Erwähnungen überhaupt entstehen.

Die Quellen für LLM-Zitationen

Erwähnungen in KI-Antworten können aus zwei unterschiedlichen Systemlogiken stammen.

1. Trainingsdaten-basierte Erwähnungen

Ein Teil der Informationen, die Sprachmodelle verwenden, stammt aus den Trainingsdaten. Diese bestehen aus großen Mengen öffentlich zugänglicher Texte. Dazu zählen beispielsweise:

  • Medienartikel
  • Wikipedia
  • wissenschaftliche Publikationen
  • frei zugängliche Websites

Wenn eine Marke oder Quelle in diesen Texten häufig vorkommt, kann sie später in Antworten erscheinen. Das gilt auch dann, wenn das System keine aktuelle Websuche durchführt.

INSERT_STEADY_NEWSLETTER_SIGNUP_HERE

Das Problem: Trainingsdaten sind in der Regel nicht transparent dokumentiert. Daher lässt sich kaum nachvollziehen, warum eine bestimmte Quelle genannt wird und eine andere nicht.

2. Retrieval-basierte Live-Zitationen

Viele moderne Systeme ergänzen ihr Modellwissen durch externe Suchindexe. Dieses Verfahren wird als Retrieval-Augmented Generation (RAG) bezeichnet.

Sie möchten eine kurze Einschätzung zur SEO-Performance Ihrer Website?
Schreiben Sie mich einfach an und nennen Sie mir die aktuellen Herausforderungen.

KONTAKT

Der Ablauf ist relativ einfach:

  1. Eine Frage wird an ein Suchsystem übergeben.
  2. Relevante Dokumente werden aus einem Index abgerufen.
  3. Das Sprachmodell generiert daraus eine zusammenhängende Antwort.

Teilweise werden die verwendeten Dokumente anschließend als Quellen genannt.

In solchen Fällen ähnelt der Prozess einer klassischen Websuche. Allerdings existieren keine stabilen Rankings wie bei Google. Antworten können sich bei identischer Anfrage jederzeit verändern. Zudem wissen wir nicht, woher die Daten stammen und ob sie aktuell sind oder nicht.

Tools wie rankscale messen die LLM-Sichtbarkeit.

Abgrenzung zu SEO

LLM-Zitationen werden häufig mit organischen Suchergebnissen verglichen. Tatsächlich handelt es sich um unterschiedliche Systeme.

  • AI Overviews von Google basieren in vielen Fällen auf klassischen Suchergebnissen. Die verwendeten Quellen werden meist klar verlinkt.
  • Featured Snippets sind ebenfalls Teil der traditionellen Suche. Sie zeigen eine konkrete URL als Quelle und basieren auf stabilen Rankings im Index.
  • Generative Antworten funktionieren anders. Quellen können erscheinen, müssen es aber nicht. Außerdem ist nicht immer klar, welche Dokumente tatsächlich verwendet wurden.

Was die Messung von LLM-Zitationen leisten kann

Als Kennzahl haben LLM-Zitationen vor allem eine beobachtende Funktion. Sie zeigen, welche Akteure in generativen Antworten vorkommen und welche nicht.

Daraus lassen sich mehrere Analysen ableiten:

  • Welche Marken werden bei bestimmten Fragen genannt
  • Welche Anbieter in einem Markt besonders präsent sind
  • Welche Quellen ein Themenfeld dominieren

Damit ähneln LLM-Zitationen eher einem Sichtbarkeitsindikator als einer klassischen Traffic-Kennzahl.

Grenzen der Kennzahl

Ein Grundproblem von Sprachmodellen sind Halluzinationen. Sprachmodelle können Quellen falsch zuordnen oder sogar vollständig erfinden. Eine genannte Website muss daher nicht zwingend tatsächlich Grundlage der Antwort gewesen sein.

Hinzu kommt die Instabilität generativer Systeme. Identische Fragen können völlig unterschiedliche Antworten erzeugen. Damit schwankt auch die Zahl der Zitationen.

Ein weiterer Faktor ist der Bias der Trainingsdaten. Bekannte Marken tauchen häufiger in großen Textkorpora auf und werden deshalb auch häufiger genannt. Neue oder kleinere Anbieter haben es deutlich schwerer.

Auch der direkte Nutzen ist bisher überschaubar. Selbst wenn eine Quelle genannt wird, führt das selten zu messbaren Klicks. Generative Antworten sind häufig bereits so vollständig, dass Nutzer die ursprüngliche Quelle nicht mehr aufrufen.

Warum SEO planbar ist – und GEO nicht

SEO lässt sich relativ gut planen, weil es auf klaren Mechanismen und Daten basiert. Inhalte werden für konkrete Suchanfragen erstellt. Wenn eine Seite ein Thema besser, strukturierter oder umfassender behandelt als andere, steigen die Chancen auf gute Rankings. Diese lassen sich jederzeit messen und mit Trial & Error kontinuierlich verbessern.

Der Ablauf von SEO ist in der Praxis relativ nachvollziehbar:

  1. relevante Suchbegriffe identifizieren
  2. Inhalte gezielt dafür erstellen
  3. Rankings und Traffic messen
  4. Inhalte weiter optimieren

Damit entsteht ein planbarer und wiederholbarer Prozess. SEOs planen strategisch für welche Themen man sichtbar werden will und kann den Erfolg über Rankings und Klicks beobachten und nachweisen.

Bei GEO funktioniert dieses Prinzip nicht.

Generative Systeme liefern keine stabilen Trefferlisten, es gibt keine Rankings, an denen man sich orientieren könnte. Sie erzeugen jedes Mal eine neue Antwort. Ob eine Marke oder Quelle erwähnt wird, ist deshalb nicht vorhersehbar und lässt sich auch nicht gezielt „ranken“.

Eine Website kann in einer Antwort erscheinen oder vollständig fehlen, obwohl sich am Inhalt nichts geändert hat. Wer zitiert wird, lässt sich kaum direkt beeinflussen mit Ausnahme von Produkttests oder Vergleichen, sofern man bereits als Marktführer überall präsent ist.

In der Praxis bedeutet das: Während SEO gezielt und nachhaltig auf Sichtbarkeit für bestimmte Suchanfragen optimiert werden kann, lässt sich GEO nur indirekt beeinflussen. Man kann zwar die Wahrscheinlichkeit erhöhen, erwähnt zu werden. Garantieren lässt sich das jedoch nicht. Vieles ist und bleibt dem Zufall überlassen.

Deshalb bleiben SEO und Brandbuilding bis auf weiteres die Grundlagen für Sichtbarkeit. Wer in Suchsystemen nicht sichtbar ist, wird auch in generativen Antworten kaum eine Rolle spielen.

Warum SEO die Grundlage für GEO bleibt

Generative Systeme greifen in vielen Fällen auf dieselben Strukturen zurück, die auch klassische Suchmaschinen nutzen:

  • indexierte Inhalte
  • klar strukturierte Dokumente
  • starke Entitäten und Marken
  • Erwähnungen in relevanten Quellen

Ohne diese Grundlagen existiert eine Website für Suchsysteme faktisch nicht. Damit fehlt auch die Basis für mögliche Erwähnungen in generativen Antworten.

SEO sorgt dafür, dass Inhalte überhaupt auffindbar sind, thematisch korrekt eingeordnet werden, in Suchindexen präsent bleiben und von anderen Quellen referenziert werden.

GEO baut auf genau diesen Voraussetzungen auf. Wer im Web nicht sichtbar ist, kann auch im generativen Wissensraum kaum erscheinen.

Sie möchten eine kurze Einschätzung zur SEO-Performance Ihrer Website?
Schreiben Sie mich einfach an und nennen Sie mir die aktuellen Herausforderungen.

KONTAKT

LLM-Zitationen sind daher ein interessantes Beobachtungsinstrument, aber nicht viel mehr.f Sie geben uns keine Informationen für eine inhaltliche Optimerung, anders als SEO-Tools. Zu glauben, dass es reicht, ein paar Sätze zu ändern, um dauerhaft in KI-Systemen zitiert zu werden ist eine naive Vorstellung.

GEO ersetzt kein SEO. Im Gegenteil: Ohne funktionierendes SEO fehlt die infrastrukturelle Grundlage, auf der generative Systeme ihre Antworten überhaupt zusammenstellen können.

 

Udo Raaf (Geschäftsführer)

Udo Raaf ist Publisher und SEO-Berater mit über 15 Jahren Erfahrung in der strategischen Suchmaschinenoptimierung für Unternehmen, Agenturen und gemeinnützige Organisationen.

Sie möchten wissen, welches Potenzial in Ihrer Website steckt?
Füllen Sie den nachfolgenden Fragebogen aus für eine unverbindliche Ersteinschätzung Ihres Projekts. Ich arbeite mit einem erstklassigen Netzwerk aus Web-Entwicklern, KI-Experten und Autoren zusammen, um maßgeschneiderte Lösungen anzubieten.

Name