Speakable Schema-Markup: So wird Ihr Content vorgelesen
Speakable Schema markiert Textpassagen für Sprachassistenten und AI-Systeme. Dieser Guide erklärt Implementierung, optimale Passagenauswahl und DACH-spezifische Sprachbesonderheiten.
Was ist Speakable Schema-Markup?
Speakable Schema-Markup ist ein strukturiertes Datenformat (JSON-LD), das bestimmte Textpassagen einer Webseite als besonders geeignet für die sprachliche Ausgabe durch Sprachassistenten und AI-Systeme kennzeichnet. Das Speakable-Property ist Teil des Schema.org-Standards und wurde ursprünglich von Google für den Google Assistant entwickelt. Heute ist es auch für andere AI-Systeme wie Alexa, Siri (Apple Intelligence) und Perplexity AI relevant, die gesprochene Antworten aus Webinhalten generieren.
Der technische Mechanismus: Speakable-Markup teilt Crawlern mit, welche HTML-Elemente einer Seite die prägnantesten, eigenständigsten und audio-geeigneten Passagen enthalten. AI-Sprachsysteme nutzen diese Markierungen, um bei Voice-Queries die richtigen Textabschnitte vorzulesen statt den gesamten Seiteninhalt zu verarbeiten. Für Unternehmen bedeutet das: Wer Speakable korrekt implementiert, erhöht die Wahrscheinlichkeit, in Voice-Searches und AI-Antworten als Quelle genannt zu werden.
Speakable ist eng verwandt mit der allgemeinen GEO-Optimierung für Schema-Markup. Eine Einführung in das gesamte Schema-Ökosystem bietet der Artikel JSON-LD Schema-Markup für AI-Sichtbarkeit im DACH-Raum.
Welche Inhalte sollten mit Speakable markiert werden?
Nicht jede Textpassage ist für Speakable-Markup geeignet. Sprachassistenten benötigen kurze, eigenständige und klar strukturierte Antworten. Die folgenden Kriterien bestimmen, welche Passagen als Speakable markiert werden sollten:
Geeignete Inhaltstypen
- Definitionen und Erklärungen: Kurze, prägnante Antworten auf W-Fragen ("Was ist X?", "Wie funktioniert Y?"). Optimal: 2-4 Sätze, 40-90 Wörter.
- FAQ-Antworten: Strukturierte Antworten auf häufig gestellte Fragen, besonders wenn die Antwort ohne Kontext verständlich ist.
- Zusammenfassungen: Einleitungsabsätze die den Kerninhalt eines Artikels komprimiert darstellen.
- Handlungsanweisungen: Klare Step-by-Step-Anleitungen, die auch als gesprochene Schritt-für-Schritt-Anleitung funktionieren.
- Statistiken und Fakten: Konkrete Zahlenangaben mit Quellenangabe, die als eigenständige Aussage funktionieren.
Ungeeignete Inhaltstypen
- Tabellen und Listen (schlechte Audio-Darstellung)
- Code-Beispiele und technische Strings
- Inhalte mit Pronomen-Referenzen ("Diese Methode...", "Wie oben erwähnt...")
- Navigationselemente und UI-Text
- Werbetexte und CTAs
Die optimale Passage-Länge für deutschsprachige Inhalte liegt bei 60-120 Wörtern – kürzer als englische Passagen, da deutsche Komposita mehr Informationsdichte pro Wort bieten. Das entspricht der allgemeinen Empfehlung für Voice Search und AI-GEO-Optimierung.
Wie implementiert man Speakable Schema-Markup?
Speakable-Markup kann über zwei Methoden implementiert werden: CSS-Selektor-Referenz (empfohlen) oder XPath-Referenz (veraltet). Die CSS-Methode ist stabiler bei HTML-Änderungen und einfacher zu warten.
Methode 1: CSS-Selektor (empfohlen)
{
"@context": "https://schema.org",
"@type": "Article",
"name": "Speakable Schema-Markup: So wird Ihr Content vorgelesen",
"headline": "Speakable Schema-Markup: So wird Ihr Content vorgelesen",
"url": "https://ihre-domain.de/blog/speakable-schema-markup",
"speakable": {
"@type": "SpeakableSpecification",
"cssSelector": [
".article-intro",
".speakable-summary",
"h2",
".faq-answer"
]
}
}
Methode 2: XPath (Fallback für ältere Systeme)
{
"@context": "https://schema.org",
"@type": "Article",
"speakable": {
"@type": "SpeakableSpecification",
"xpath": [
"/html/head/title",
"/html/body/article/section[@class='intro']/p[1]",
"/html/body/article//h2"
]
}
}
Vollständige Implementierung mit @graph-Pattern
Für DACH-Websites empfiehlt sich die Integration von Speakable in einen bestehenden @graph-Block, um alle Schema-Typen konsistent zu halten:
{
"@context": "https://schema.org",
"@graph": [
{
"@type": "Organization",
"@id": "https://ihre-domain.de/#organization",
"name": "Ihr Unternehmen GmbH",
"url": "https://ihre-domain.de"
},
{
"@type": "Article",
"@id": "https://ihre-domain.de/blog/ihr-artikel#article",
"headline": "Artikeltitel",
"author": {
"@id": "https://ihre-domain.de/#organization"
},
"publisher": {
"@id": "https://ihre-domain.de/#organization"
},
"datePublished": "2026-03-15",
"dateModified": "2026-03-15",
"speakable": {
"@type": "SpeakableSpecification",
"cssSelector": [
".article-summary",
".speakable",
"h2"
]
}
},
{
"@type": "WebPage",
"@id": "https://ihre-domain.de/blog/ihr-artikel#webpage",
"url": "https://ihre-domain.de/blog/ihr-artikel",
"speakable": {
"@type": "SpeakableSpecification",
"cssSelector": [".page-intro", "h1", "h2"]
},
"isPartOf": {
"@id": "https://ihre-domain.de/#website"
}
}
]
}
Wie werden HTML-Elemente für Speakable vorbereitet?
Das JSON-LD allein reicht nicht – die referenzierten CSS-Selektoren müssen im HTML korrekt implementiert sein. Empfohlene Vorgehensweise:
1. Dedizierte CSS-Klassen vergeben:
<!-- Intro-Paragraph als Speakable markieren -->
<p class="article-intro speakable">
Speakable Schema-Markup kennzeichnet Textpassagen für die
Sprachausgabe durch AI-Systeme. Mit der cssSelector-Methode
werden spezifische HTML-Elemente referenziert.
</p>
<!-- FAQ-Antworten als Speakable markieren -->
<div class="faq-item">
<h3>Was kostet eine GEO-Optimierung?</h3>
<p class="faq-answer speakable">
Eine professionelle GEO-Optimierung kostet je nach Umfang
zwischen 500 und 5.000 Euro monatlich. Kleinere Unternehmen
beginnen mit einem Einmalaudit ab 299 Euro.
</p>
</div>
2. Überschriften automatisch einschließen:
H2-Überschriften (h2) sind generell gute Speakable-Kandidaten, da sie Themenabschnitte strukturieren und in der Regel kurze, prägnante Aussagen enthalten. Sie können direkt im CSS-Selektor referenziert werden ohne individuelle Klassen.
3. Passagen testen: Lesen Sie jede markierte Passage laut vor. Wenn die Passage ohne visuellen Kontext verständlich klingt, ist sie für Speakable geeignet.
Welche DACH-spezifischen Sprachbesonderheiten gelten?
Für deutschsprachige Speakable-Inhalte gelten besondere Anforderungen, die sich aus den Eigenschaften der deutschen Sprache ergeben:
Komposita aufbrechen: Lange zusammengesetzte Wörter wie "Suchmaschinenoptimierungsagentur" sind für TTS-Systeme (Text-to-Speech) schwierig. Speakable-Passagen sollten bevorzugt kürzere Alternativen oder Bindestrich-Kompositionen verwenden: "Suchmaschinen-Optimierungsagentur" oder "Agentur für Suchmaschinenoptimierung".
Formale Anrede beibehalten: Im DACH-Kontext wird überwiegend das formelle "Sie" genutzt. Speakable-Passagen sollten dieselbe Anrede wie der restliche Seiteninhalt verwenden, um inkonsistente Sprachausgaben zu vermeiden.
Schweizer Rechtschreibung: Für Websites, die explizit den Schweizer Markt ansprechen, sollten Speakable-Passagen das "ss" statt "ß" verwenden (z. B. "strasse" statt "straße"), da Swiss-German TTS-Engines diese Variante bevorzugen.
Zahlendarstellung: Deutsche TTS-Systeme lesen "1.500 Euro" als "eintausend Punkt fünfhundert Euro" – falsch. In Speakable-Passagen Zahlen entweder ausschreiben ("fünfzehnhundert Euro") oder mit Leerzeichen als Tausendertrenner angeben ("1 500 Euro").
Wie teste ich Speakable Schema-Markup?
Google Rich Results Test: Unter search.google.com/test/rich-results kann Speakable-Markup validiert werden. Der Test zeigt, welche Passagen Google als speakable erkennt und ob Fehler in der Implementierung vorliegen.
Schema.org Validator: Unter validator.schema.org lässt sich das vollständige JSON-LD auf Korrektheit prüfen – unabhängig von Google-spezifischen Validierungsregeln.
Manueller Test: Den JSON-LD-Block in die Browser-Konsole einfügen und mit JSON.parse() auf Syntaxfehler prüfen. Häufiger Fehler: nicht-escapte Anführungszeichen in Beschreibungstexten.
Das vollständige Schema-Audit inklusive Speakable-Prüfung ist über das GeoRanks-Audit-Tool verfügbar.
Welche häufigen Fehler entstehen bei Speakable-Implementierungen?
Fehler 1: CSS-Selektor referenziert nicht-existierende Elemente Wenn der CSS-Selektor im JSON-LD auf eine Klasse verweist, die im HTML nicht vorhanden ist, findet der Crawler keine Speakable-Passagen. Vor dem Deployment immer prüfen, ob der referenzierte Selektor im DOM tatsächlich vorhanden ist.
Fehler 2: Speakable auf der gesamten Seite statt auf Passagen
"cssSelector": ["body"] oder "cssSelector": ["article"] markiert den gesamten Seiteninhalt als speakable. Das ist kontraproduktiv: AI-Systeme benötigen präzise, kurze Passagen, keine vollständigen Seitentexte. Spezifische Selektoren wie .speakable oder h2 sind weit besser.
Fehler 3: Speakable nur im WebPage-Schema statt im Article-Schema Wenn eine Seite sowohl ein WebPage- als auch ein Article-Schema-Objekt enthält, sollte Speakable in beiden definiert werden – oder zumindest im Article-Objekt. WebPage allein wird von einigen Crawlern für Speakable-Erkennung nicht berücksichtigt.
Fehler 4: Speakable-Passagen enthalten Formatierungen
Sichtbarer HTML-Text mit <strong>, <em> oder <a>-Tags kann von TTS-Systemen fehlerhaft interpretiert werden. Wenn möglich, Speakable-CSS-Selektoren auf Elemente zeigen lassen, die reinen Fließtext ohne Inline-Formatierungen enthalten.
Fehler 5: Kein Speakable auf mobiler Version Bei separaten Mobile-Layouts (mit geänderten CSS-Klassen) kann es passieren, dass Speakable-Selektoren auf der mobilen Version nicht existieren. Da viele AI-Crawler mobile-first crawlen (Googlebot, Applebot-Extended), muss Speakable auf dem mobilen Layout verfügbar sein.
Wie viele Speakable-Passagen sollte eine Seite haben?
Zu wenige Speakable-Passagen liefern AI-Crawlern wenig Material; zu viele Passagen senken die Präzision. Empfohlene Richtwerte:
- Einfache Landingpages (1.000-2.000 Wörter): 3-5 Speakable-Passagen
- Ausführliche Blog-Artikel (2.000-4.000 Wörter): 5-10 Passagen
- FAQ-Seiten: Jede FAQ-Antwort als separate Speakable-Passage (typisch: 8-15 Passagen)
- Produkt- / Service-Seiten: 2-4 Passagen für Kernnutzen und Preisinfo
Wenn alle H2-Überschriften als Speakable-Selektor eingeschlossen sind ("cssSelector": ["h2"]), erhöht das automatisch die Anzahl der Passagen. Überschriften sind kurz, eigenständig und enthalten das Thema des folgenden Abschnitts – ideal für Voice-AI-Kurzantworten.
Welche Voice-Assistants nutzen Speakable-Markup im DACH-Markt?
Im DACH-Markt sind drei Voice-Assistants besonders relevant für Speakable-optimierte Inhalte:
Google Assistant / Google Home: Google war der erste Anbieter, der Speakable in seine Richtlinien aufgenommen hat. Google Assistant nutzt Speakable-Markup bei der Generierung von Antworten auf sprachliche Informationsanfragen. Bei News-Artikeln verliest Google Assistant bevorzugt die als speakable markierten Passagen statt den gesamten Artikeltext.
Apple Siri mit Apple Intelligence: Mit der Einführung von Apple Intelligence (2025) hat Apple die Fähigkeit von Siri, strukturierte Webinhalte zu verarbeiten, erheblich ausgebaut. Applebot-Extended crawlt Websites gezielt nach Speakable-Markup und bereitet diese Passagen für Siri-Antworten auf. Der DACH-Markt ist dabei besonders relevant, da deutschsprachige Siri-Nutzung in Österreich und der Schweiz besonders hoch ist.
Amazon Alexa mit Bedrock: Amazons Alexa nutzt Inhalte aus dem Amazon Bedrock-Index, der von Amazonbot aufgebaut wird. Für Skills und Flash Briefings sind speakable-ausgezeichnete Inhalte bevorzugte Quellen.
Perplexity Voice: Perplexity AI hat Ende 2025 eine Voice-Suchfunktion eingeführt, die auf demselben Retrieval-System wie die Textsuche basiert. Speakable-Passagen erhöhen auch hier die Chance, als gesprochene Antwortquelle ausgewählt zu werden.
Für DACH-Unternehmen bedeutet das: Speakable ist nicht mehr nur eine Google-spezifische Maßnahme, sondern eine Cross-Plattform-Optimierung für das gesamte Voice-AI-Ökosystem.
Wie unterscheidet sich Speakable-Markup für verschiedene Seitentypen?
Die optimale Speakable-Strategie variiert je nach Seitentyp:
Produkt- und Dienstleistungsseiten
Für Produkt- und Dienstleistungsseiten sollten vor allem die Kernvorteile (3-5 Bullet Points als Fließtext formuliert) und die Preisübersicht als Speakable markiert werden. Voice-Nutzer fragen häufig nach Preisen, Öffnungszeiten und Leistungsumfang:
<div class="service-summary speakable">
<p>Die GEO-Basis-Analyse von GeoRanks prüft 45 Faktoren in 8 Kategorien
und liefert innerhalb von 60 Sekunden einen detaillierten Score mit
priorisierten Handlungsempfehlungen. Der Preis beträgt 299 Euro pro Analyse.</p>
</div>
Blog-Artikel und Ratgeber
Für informationale Inhalte eignen sich die Einleitung (Definition des Themas), Zusammenfassungen nach H2-Abschnitten und FAQ-Antworten. Besonders effektiv ist der "Definition-first"-Ansatz: Der erste Satz jedes H2-Abschnitts als separate Speakable-Einheit.
FAQ-Seiten
FAQ-Seiten sind der ideale Anwendungsfall für Speakable: Jede FAQ-Antwort ist per Definition eigenständig und audio-geeignet. Die Kombination aus FAQPage-Schema und Speakable-Markup auf denselben Elementen ist die stärkste Doppelauszeichnung für AI-Sichtbarkeit.
Standort- und Kontaktseiten
Für lokale Unternehmen sind Öffnungszeiten, Adresse und Kontaktinformationen als Speakable besonders wertvoll. Voice-Anfragen wie "Wann hat [Name] geöffnet?" oder "Wie komme ich zu [Name]?" werden von AI-Assistants bevorzugt mit Speakable-markierten Inhalten beantwortet.
Wie misst man den Erfolg von Speakable-Markup?
Direktes Tracking von Speakable-Zitationen ist mit Standardanalytics nicht möglich. Folgende indirekte Messmethoden sind hilfreich:
Google Search Console – Voice Search Filter: In der GSC-Filterung nach Gerät kann zwischen "Desktop", "Mobile" und "Tablet" unterschieden werden. Voice-Suchanfragen auf Smart Speakern (Google Home) erscheinen als Desktop-Aufrufe. Ein Anstieg von Desktop-Impressions nach Speakable-Implementierung kann ein Indikator sein.
Brand Monitoring: Speakable erhöht die Wahrscheinlichkeit, dass der Unternehmensname in AI-Antworten genannt wird – auch ohne Klick auf die Website. Brand-Monitoring-Tools wie Mention oder Brandwatch können AI-Erwähnungen trackbar machen.
Direktes Testen: Mit einem deutschen Sprachassistenten (Google Home, Siri, Alexa) direkt Fragen stellen, die Speakable-Inhalte der eigenen Website beantworten sollten. Erscheint die Website als Quelle? Wird die Antwort korrekt vorgelesen?
Fazit: Speakable als Teil der Schema-Strategie
Speakable Schema-Markup ist eine der effektivsten Maßnahmen, um AI-Systemen explizit mitzuteilen, welche Inhalte für die Sprachausgabe geeignet sind. Die wichtigsten Punkte:
- CSS-Selektor-Methode für stabile und wartbare Implementierung verwenden
- 40-120 Wörter pro Speakable-Passage als Zielgröße für deutschsprachige Inhalte
- Eigenständigkeit testen: Passage muss ohne Kontext verständlich sein
- In @graph-Pattern integrieren für konsistentes Schema-Markup
- Mit FAQPage-Schema kombinieren für maximale AI-Signaldichte
- Alle vier Voice-Plattformen (Google, Apple, Amazon, Perplexity) profitieren von Speakable
- Regelmäßig mit Google Rich Results Test validieren
Erweitern Sie Ihre Schema-Strategie mit dem vollständigen Schema-Audit: GEO-Analyse starten.