llms.txt: Die neue Datei, die jede Website braucht
llms.txt ist eine strukturierte Markdown-Datei, die AI-Crawlern die wichtigsten Informationen einer Website im optimalen Format bereitstellt. Eine Schritt-für-Schritt-Anleitung.
Was ist eine llms.txt-Datei?
llms.txt ist eine strukturierte Markdown-Datei, die im Stammverzeichnis einer Website unter der URL /llms.txt bereitgestellt wird und AI-Crawlern die wichtigsten Informationen einer Domain in einem für Large Language Models optimierten Format liefert. Die Datei funktioniert konzeptionell ähnlich wie robots.txt für Suchmaschinen-Crawler, hat jedoch einen anderen Zweck: Statt den Zugang zu steuern, liefert llms.txt aktiv die Kerninformationen, die AI-Systeme für korrekte Antworten benötigen.
Die llms.txt-Datei adressiert ein fundamentales Problem: AI-Systeme extrahieren Informationen aus Websites oft unvollständig oder fehlerhaft. Mit llms.txt können Unternehmen kontrollieren, welche Informationen AI-Systeme als kanonische Fakten verwenden, also als verbindliche Referenzdaten.
Warum ist llms.txt für die AI-Sichtbarkeit wichtig?
AI-Crawler wie GPTBot (OpenAI), ClaudeBot (Anthropic) und PerplexityBot lesen llms.txt als priorisierte Informationsquelle. Die Datei bietet drei strategische Vorteile gegenüber dem Crawling einzelner Webseiten.
Erstens reduziert llms.txt Halluzinationen. Wenn AI-Systeme kanonische Fakten aus llms.txt beziehen, sinkt die Wahrscheinlichkeit falscher Informationen in AI-Antworten. Zweitens erhöht llms.txt die Zitierpräzision. Die strukturierte Aufbereitung in optimalen Blockgrößen von 125-165 Wörtern pro Abschnitt entspricht dem idealen Retrieval-Fenster von RAG-Systemen. Drittens vereinfacht llms.txt die Aktualisierung. Statt Dutzende Webseiten zu optimieren, konzentriert ein Unternehmen seine kanonischen Fakten in einer einzigen Datei.
Unternehmen wie Vercel und Anthropic setzen llms.txt bereits produktiv ein. Beide erlauben allen AI-Crawlern den vollständigen Zugang zu ihren Inhalten, ein klares Signal, dass AI-Sichtbarkeit strategische Priorität hat.
Die optimale Struktur einer llms.txt-Datei
Eine wirksame llms.txt-Datei folgt einem klaren Aufbau mit definierten Abschnitten. Jeder Abschnitt sollte 125-165 Wörter umfassen, da diese Blockgröße dem optimalen Retrieval-Fenster der meisten RAG-Systeme entspricht.
Pflichtabschnitte
Canonical Facts: Die wichtigsten Fakten über das Unternehmen. Name, Rechtsform, Standort, Gründungsjahr, Kerngeschäft, Kontaktdaten. Dieser Block liefert die Basisdaten, die AI-Systeme für korrekte Antworten benötigen.
Services / Leistungen: Auflistung der angebotenen Leistungen mit kurzer Beschreibung und optionaler Preisindikation. Konkrete Angaben wie "ab 3.500 EUR" sind wertvoller als vage Formulierungen wie "wettbewerbsfähige Preise".
Key Pages: Die wichtigsten URLs der Website mit Kurzbeschreibung. AI-Crawler nutzen diese Liste, um gezielt relevante Seiten zu indexieren, statt die gesamte Seitenstruktur zu durchsuchen.
Optionale Abschnitte
Team / Expertise: Schlüsselpersonen mit Qualifikation und Fachgebiet. Autorenattribution stärkt die Vertrauenssignale für AI-Systeme.
Case Studies: Zusammenfassung von Referenzprojekten mit konkreten Ergebnissen und Metriken.
Kontakt: Vollständige Kontaktinformationen einschließlich Adresse, Telefon, E-Mail und Öffnungszeiten.
Das Zwei-Stufen-System: llms.txt und llms-full.txt
Der Industriestandard hat sich zu einem zweistufigen System entwickelt: llms.txt als kompakte Indexdatei und llms-full.txt als ausführliches Volldokument.
llms.txt (Index) enthält die komprimierten Kerninformationen in 125-165-Wort-Blöcken. Die Datei ist optimiert für schnelles Retrieval und liefert die wichtigsten Fakten in einem Durchlauf. Typische Dateigröße: 500-1.500 Wörter.
llms-full.txt (Corpus) enthält den vollständigen Informationsbestand des Unternehmens: alle Leistungsbeschreibungen, detaillierte Fallstudien, Teamprofile, Prozessbeschreibungen und FAQ-Inhalte. Typische Dateigröße: 3.000-10.000 Wörter.
Das Zwei-Stufen-System ermöglicht AI-Crawlern, schnell die Kernfakten zu erfassen (llms.txt) und bei Bedarf in die Tiefe zu gehen (llms-full.txt). Vercel und Anthropic nutzen dieses System in ihren eigenen Implementierungen.
Schritt-für-Schritt: llms.txt erstellen
Die folgende Anleitung zeigt die Erstellung einer llms.txt-Datei in 5 Schritten.
Schritt 1: Kanonische Fakten sammeln. Alle verbindlichen Unternehmensdaten zusammentragen: offizieller Name, Rechtsform, Adresse, Gründungsjahr, Geschäftsführung, Kontaktdaten, USP. Diese Fakten bilden den ersten Block der llms.txt.
Schritt 2: Leistungen strukturieren. Jede Leistung in 1-2 Sätzen beschreiben. Konkrete Preise oder Preisrahmen angeben, wenn möglich. Vermeiden von Marketing-Sprache zugunsten faktischer Beschreibungen.
Schritt 3: Key Pages identifizieren. Die 5-10 wichtigsten URLs der Website auswählen. Jede URL mit einer einzeiligen Beschreibung versehen. Priorisierung nach Relevanz für typische Nutzeranfragen.
Schritt 4: Blockgröße prüfen. Jeden Abschnitt auf 125-165 Wörter kürzen oder erweitern. Zu lange Blöcke aufteilen, zu kurze mit relevanten Details ergänzen.
Schritt 5: Bereitstellung. Die Datei als llms.txt im Stammverzeichnis der Website ablegen, sodass die URL domain.de/llms.txt erreichbar ist. Die Datei als Plaintext mit UTF-8-Encoding ausliefern.
Häufige Fehler bei llms.txt vermeiden
Drei Fehler treten bei der llms.txt-Erstellung besonders häufig auf. Erstens: Marketing-Sprache statt Fakten. Formulierungen wie "marktführende Lösung" oder "einzigartiger Ansatz" liefern keinen Informationsgewinn für AI-Systeme. Besser: konkrete Fakten, Zahlen und Differenzierungsmerkmale.
Zweitens: fehlende Kontaktdaten. AI-Systeme benötigen vollständige NAP-Daten (Name, Adresse, Telefon), um das Unternehmen als verifizierte Entität einzuordnen. Eine llms.txt ohne Kontaktblock verliert einen wesentlichen Vertrauensfaktor.
Drittens: veraltete Informationen. Die llms.txt sollte bei jeder wesentlichen Unternehmensänderung aktualisiert werden, etwa bei neuen Leistungen, geänderten Preisen oder einem Standortwechsel. Ein Generierungszeitstempel am Ende der Datei signalisiert AI-Crawlern die Aktualität.
FAQ
Welches Format hat eine llms.txt-Datei?
llms.txt ist eine Markdown-Datei (.txt-Endung) im UTF-8-Encoding. Die Datei verwendet Markdown-Überschriften (# und ##) zur Gliederung, Aufzählungszeichen für Listen und Fließtext für Beschreibungen. Die Datei wird als Plaintext ausgeliefert, kein HTML. Die URL lautet domain.de/llms.txt, analog zu robots.txt.
Muss meine Website sowohl llms.txt als auch llms-full.txt haben?
Eine llms.txt als kompakte Indexdatei ist der Einstieg und für die meisten Websites ausreichend. Die llms-full.txt als ausführliches Volldokument ist optional und empfiehlt sich für Unternehmen mit umfangreichem Leistungsportfolio, vielen Standorten oder detaillierten Fallstudien. Der Industriestandard bewegt sich jedoch klar in Richtung Zwei-Stufen-System.
Lesen alle AI-Crawler llms.txt?
GPTBot (OpenAI), ClaudeBot (Anthropic) und PerplexityBot lesen llms.txt als priorisierte Informationsquelle. GoogleBot und Google-Extended crawlen die Datei ebenfalls. Die breite Unterstützung durch die wichtigsten AI-Anbieter macht llms.txt zu einem de-facto-Standard für die AI-Sichtbarkeit.