1. April 20269 Min. Lesezeit

Vincent WeberGründer, GeoRanks

Speakable Schema-Markup: So wird Ihr Content vorgelesen

Speakable Schema markiert Textpassagen für Sprachassistenten und AI-Systeme. Dieser Guide erklärt Implementierung, optimale Passagenauswahl und DACH-spezifische Sprachbesonderheiten.

Was ist Speakable Schema-Markup?

Speakable Schema-Markup ist ein strukturiertes Datenformat (JSON-LD), das bestimmte Textpassagen einer Webseite als besonders geeignet für die sprachliche Ausgabe durch Sprachassistenten und AI-Systeme kennzeichnet. Das Speakable-Property ist Teil des Schema.org-Standards und wurde ursprünglich von Google für den Google Assistant entwickelt. Heute ist es auch für andere AI-Systeme wie Alexa, Siri (Apple Intelligence) und Perplexity AI relevant, die gesprochene Antworten aus Webinhalten generieren.

Der technische Mechanismus: Speakable-Markup teilt Crawlern mit, welche HTML-Elemente einer Seite die prägnantesten, eigenständigsten und audio-geeigneten Passagen enthalten. AI-Sprachsysteme nutzen diese Markierungen, um bei Voice-Queries die richtigen Textabschnitte vorzulesen statt den gesamten Seiteninhalt zu verarbeiten. Für Unternehmen bedeutet das: Wer Speakable korrekt implementiert, erhöht die Wahrscheinlichkeit, in Voice-Searches und AI-Antworten als Quelle genannt zu werden.

Speakable ist eng verwandt mit der allgemeinen GEO-Optimierung für Schema-Markup. Eine Einführung in das gesamte Schema-Ökosystem bietet der Artikel JSON-LD Schema-Markup für AI-Sichtbarkeit im DACH-Raum.

Welche Inhalte sollten mit Speakable markiert werden?

Nicht jede Textpassage ist für Speakable-Markup geeignet. Sprachassistenten benötigen kurze, eigenständige und klar strukturierte Antworten. Die folgenden Kriterien bestimmen, welche Passagen als Speakable markiert werden sollten:

Geeignete Inhaltstypen

Definitionen und Erklärungen: Kurze, prägnante Antworten auf W-Fragen ("Was ist X?", "Wie funktioniert Y?"). Optimal: 2-4 Sätze, 40-90 Wörter.
FAQ-Antworten: Strukturierte Antworten auf häufig gestellte Fragen, besonders wenn die Antwort ohne Kontext verständlich ist.
Zusammenfassungen: Einleitungsabsätze die den Kerninhalt eines Artikels komprimiert darstellen.
Handlungsanweisungen: Klare Step-by-Step-Anleitungen, die auch als gesprochene Schritt-für-Schritt-Anleitung funktionieren.
Statistiken und Fakten: Konkrete Zahlenangaben mit Quellenangabe, die als eigenständige Aussage funktionieren.

Ungeeignete Inhaltstypen

Tabellen und Listen (schlechte Audio-Darstellung)
Code-Beispiele und technische Strings
Inhalte mit Pronomen-Referenzen ("Diese Methode...", "Wie oben erwähnt...")
Navigationselemente und UI-Text
Werbetexte und CTAs

Die optimale Passage-Länge für deutschsprachige Inhalte liegt bei 60-120 Wörtern – kürzer als englische Passagen, da deutsche Komposita mehr Informationsdichte pro Wort bieten. Das entspricht der allgemeinen Empfehlung für Voice Search und AI-GEO-Optimierung.

Wie implementiert man Speakable Schema-Markup?

Speakable-Markup kann über zwei Methoden implementiert werden: CSS-Selektor-Referenz (empfohlen) oder XPath-Referenz (veraltet). Die CSS-Methode ist stabiler bei HTML-Änderungen und einfacher zu warten.

Methode 1: CSS-Selektor (empfohlen)

{
  "@context": "https://schema.org",
  "@type": "Article",
  "name": "Speakable Schema-Markup: So wird Ihr Content vorgelesen",
  "headline": "Speakable Schema-Markup: So wird Ihr Content vorgelesen",
  "url": "https://ihre-domain.de/blog/speakable-schema-markup",
  "speakable": {
    "@type": "SpeakableSpecification",
    "cssSelector": [
      ".article-intro",
      ".speakable-summary",
      "h2",
      ".faq-answer"
    ]
  }
}

Methode 2: XPath (Fallback für ältere Systeme)

{
  "@context": "https://schema.org",
  "@type": "Article",
  "speakable": {
    "@type": "SpeakableSpecification",
    "xpath": [
      "/html/head/title",
      "/html/body/article/section[@class='intro']/p[1]",
      "/html/body/article//h2"
    ]
  }
}

Vollständige Implementierung mit @graph-Pattern

Für DACH-Websites empfiehlt sich die Integration von Speakable in einen bestehenden @graph-Block, um alle Schema-Typen konsistent zu halten:

{
  "@context": "https://schema.org",
  "@graph": [
    {
      "@type": "Organization",
      "@id": "https://ihre-domain.de/#organization",
      "name": "Ihr Unternehmen GmbH",
      "url": "https://ihre-domain.de"
    },
    {
      "@type": "Article",
      "@id": "https://ihre-domain.de/blog/ihr-artikel#article",
      "headline": "Artikeltitel",
      "author": {
        "@id": "https://ihre-domain.de/#organization"
      },
      "publisher": {
        "@id": "https://ihre-domain.de/#organization"
      },
      "datePublished": "2026-03-15",
      "dateModified": "2026-03-15",
      "speakable": {
        "@type": "SpeakableSpecification",
        "cssSelector": [
          ".article-summary",
          ".speakable",
          "h2"
        ]
      }
    },
    {
      "@type": "WebPage",
      "@id": "https://ihre-domain.de/blog/ihr-artikel#webpage",
      "url": "https://ihre-domain.de/blog/ihr-artikel",
      "speakable": {
        "@type": "SpeakableSpecification",
        "cssSelector": [".page-intro", "h1", "h2"]
      },
      "isPartOf": {
        "@id": "https://ihre-domain.de/#website"
      }
    }
  ]
}

Wie werden HTML-Elemente für Speakable vorbereitet?

Das JSON-LD allein reicht nicht – die referenzierten CSS-Selektoren müssen im HTML korrekt implementiert sein. Empfohlene Vorgehensweise:

1. Dedizierte CSS-Klassen vergeben:

<!-- Intro-Paragraph als Speakable markieren -->
<p class="article-intro speakable">
  Speakable Schema-Markup kennzeichnet Textpassagen für die
  Sprachausgabe durch AI-Systeme. Mit der cssSelector-Methode
  werden spezifische HTML-Elemente referenziert.
</p>

<!-- FAQ-Antworten als Speakable markieren -->
<div class="faq-item">
  <h3>Was kostet eine GEO-Optimierung?</h3>
  <p class="faq-answer speakable">
    Eine professionelle GEO-Optimierung kostet je nach Umfang
    zwischen 500 und 5.000 Euro monatlich. Kleinere Unternehmen
    beginnen mit einem Einmalaudit ab 299 Euro.
  </p>
</div>

2. Überschriften automatisch einschließen: H2-Überschriften (h2) sind generell gute Speakable-Kandidaten, da sie Themenabschnitte strukturieren und in der Regel kurze, prägnante Aussagen enthalten. Sie können direkt im CSS-Selektor referenziert werden ohne individuelle Klassen.

3. Passagen testen: Lesen Sie jede markierte Passage laut vor. Wenn die Passage ohne visuellen Kontext verständlich klingt, ist sie für Speakable geeignet.

Welche DACH-spezifischen Sprachbesonderheiten gelten?

Für deutschsprachige Speakable-Inhalte gelten besondere Anforderungen, die sich aus den Eigenschaften der deutschen Sprache ergeben:

Komposita aufbrechen: Lange zusammengesetzte Wörter wie "Suchmaschinenoptimierungsagentur" sind für TTS-Systeme (Text-to-Speech) schwierig. Speakable-Passagen sollten bevorzugt kürzere Alternativen oder Bindestrich-Kompositionen verwenden: "Suchmaschinen-Optimierungsagentur" oder "Agentur für Suchmaschinenoptimierung".

Formale Anrede beibehalten: Im DACH-Kontext wird überwiegend das formelle "Sie" genutzt. Speakable-Passagen sollten dieselbe Anrede wie der restliche Seiteninhalt verwenden, um inkonsistente Sprachausgaben zu vermeiden.

Schweizer Rechtschreibung: Für Websites, die explizit den Schweizer Markt ansprechen, sollten Speakable-Passagen das "ss" statt "ß" verwenden (z. B. "strasse" statt "straße"), da Swiss-German TTS-Engines diese Variante bevorzugen.

Zahlendarstellung: Deutsche TTS-Systeme lesen "1.500 Euro" als "eintausend Punkt fünfhundert Euro" – falsch. In Speakable-Passagen Zahlen entweder ausschreiben ("fünfzehnhundert Euro") oder mit Leerzeichen als Tausendertrenner angeben ("1 500 Euro").

Wie teste ich Speakable Schema-Markup?

Google Rich Results Test: Unter search.google.com/test/rich-results kann Speakable-Markup validiert werden. Der Test zeigt, welche Passagen Google als speakable erkennt und ob Fehler in der Implementierung vorliegen.

Schema.org Validator: Unter validator.schema.org lässt sich das vollständige JSON-LD auf Korrektheit prüfen – unabhängig von Google-spezifischen Validierungsregeln.

Manueller Test: Den JSON-LD-Block in die Browser-Konsole einfügen und mit JSON.parse() auf Syntaxfehler prüfen. Häufiger Fehler: nicht-escapte Anführungszeichen in Beschreibungstexten.

Das vollständige Schema-Audit inklusive Speakable-Prüfung ist über das GeoRanks-Audit-Tool verfügbar.

Welche häufigen Fehler entstehen bei Speakable-Implementierungen?

Fehler 1: CSS-Selektor referenziert nicht-existierende Elemente Wenn der CSS-Selektor im JSON-LD auf eine Klasse verweist, die im HTML nicht vorhanden ist, findet der Crawler keine Speakable-Passagen. Vor dem Deployment immer prüfen, ob der referenzierte Selektor im DOM tatsächlich vorhanden ist.

Fehler 2: Speakable auf der gesamten Seite statt auf Passagen "cssSelector": ["body"] oder "cssSelector": ["article"] markiert den gesamten Seiteninhalt als speakable. Das ist kontraproduktiv: AI-Systeme benötigen präzise, kurze Passagen, keine vollständigen Seitentexte. Spezifische Selektoren wie .speakable oder h2 sind weit besser.

Fehler 3: Speakable nur im WebPage-Schema statt im Article-Schema Wenn eine Seite sowohl ein WebPage- als auch ein Article-Schema-Objekt enthält, sollte Speakable in beiden definiert werden – oder zumindest im Article-Objekt. WebPage allein wird von einigen Crawlern für Speakable-Erkennung nicht berücksichtigt.

Fehler 4: Speakable-Passagen enthalten Formatierungen Sichtbarer HTML-Text mit <strong>, <em> oder <a>-Tags kann von TTS-Systemen fehlerhaft interpretiert werden. Wenn möglich, Speakable-CSS-Selektoren auf Elemente zeigen lassen, die reinen Fließtext ohne Inline-Formatierungen enthalten.

Fehler 5: Kein Speakable auf mobiler Version Bei separaten Mobile-Layouts (mit geänderten CSS-Klassen) kann es passieren, dass Speakable-Selektoren auf der mobilen Version nicht existieren. Da viele AI-Crawler mobile-first crawlen (Googlebot, Applebot-Extended), muss Speakable auf dem mobilen Layout verfügbar sein.

Wie viele Speakable-Passagen sollte eine Seite haben?

Zu wenige Speakable-Passagen liefern AI-Crawlern wenig Material; zu viele Passagen senken die Präzision. Empfohlene Richtwerte:

Einfache Landingpages (1.000-2.000 Wörter): 3-5 Speakable-Passagen
Ausführliche Blog-Artikel (2.000-4.000 Wörter): 5-10 Passagen
FAQ-Seiten: Jede FAQ-Antwort als separate Speakable-Passage (typisch: 8-15 Passagen)
Produkt- / Service-Seiten: 2-4 Passagen für Kernnutzen und Preisinfo

Wenn alle H2-Überschriften als Speakable-Selektor eingeschlossen sind ("cssSelector": ["h2"]), erhöht das automatisch die Anzahl der Passagen. Überschriften sind kurz, eigenständig und enthalten das Thema des folgenden Abschnitts – ideal für Voice-AI-Kurzantworten.

Welche Voice-Assistants nutzen Speakable-Markup im DACH-Markt?

Im DACH-Markt sind drei Voice-Assistants besonders relevant für Speakable-optimierte Inhalte:

Google Assistant / Google Home: Google war der erste Anbieter, der Speakable in seine Richtlinien aufgenommen hat. Google Assistant nutzt Speakable-Markup bei der Generierung von Antworten auf sprachliche Informationsanfragen. Bei News-Artikeln verliest Google Assistant bevorzugt die als speakable markierten Passagen statt den gesamten Artikeltext.

Apple Siri mit Apple Intelligence: Mit der Einführung von Apple Intelligence (2025) hat Apple die Fähigkeit von Siri, strukturierte Webinhalte zu verarbeiten, erheblich ausgebaut. Applebot-Extended crawlt Websites gezielt nach Speakable-Markup und bereitet diese Passagen für Siri-Antworten auf. Der DACH-Markt ist dabei besonders relevant, da deutschsprachige Siri-Nutzung in Österreich und der Schweiz besonders hoch ist.

Amazon Alexa mit Bedrock: Amazons Alexa nutzt Inhalte aus dem Amazon Bedrock-Index, der von Amazonbot aufgebaut wird. Für Skills und Flash Briefings sind speakable-ausgezeichnete Inhalte bevorzugte Quellen.

Perplexity Voice: Perplexity AI hat Ende 2025 eine Voice-Suchfunktion eingeführt, die auf demselben Retrieval-System wie die Textsuche basiert. Speakable-Passagen erhöhen auch hier die Chance, als gesprochene Antwortquelle ausgewählt zu werden.

Für DACH-Unternehmen bedeutet das: Speakable ist nicht mehr nur eine Google-spezifische Maßnahme, sondern eine Cross-Plattform-Optimierung für das gesamte Voice-AI-Ökosystem.

Wie unterscheidet sich Speakable-Markup für verschiedene Seitentypen?

Die optimale Speakable-Strategie variiert je nach Seitentyp:

Produkt- und Dienstleistungsseiten

Für Produkt- und Dienstleistungsseiten sollten vor allem die Kernvorteile (3-5 Bullet Points als Fließtext formuliert) und die Preisübersicht als Speakable markiert werden. Voice-Nutzer fragen häufig nach Preisen, Öffnungszeiten und Leistungsumfang:

<div class="service-summary speakable">
  <p>Die GEO-Basis-Analyse von GeoRanks prüft 45 Faktoren in 8 Kategorien
  und liefert innerhalb von 60 Sekunden einen detaillierten Score mit
  priorisierten Handlungsempfehlungen. Der Preis beträgt 299 Euro pro Analyse.</p>
</div>

Blog-Artikel und Ratgeber

Für informationale Inhalte eignen sich die Einleitung (Definition des Themas), Zusammenfassungen nach H2-Abschnitten und FAQ-Antworten. Besonders effektiv ist der "Definition-first"-Ansatz: Der erste Satz jedes H2-Abschnitts als separate Speakable-Einheit.

FAQ-Seiten

FAQ-Seiten sind der ideale Anwendungsfall für Speakable: Jede FAQ-Antwort ist per Definition eigenständig und audio-geeignet. Die Kombination aus FAQPage-Schema und Speakable-Markup auf denselben Elementen ist die stärkste Doppelauszeichnung für AI-Sichtbarkeit.

Standort- und Kontaktseiten

Für lokale Unternehmen sind Öffnungszeiten, Adresse und Kontaktinformationen als Speakable besonders wertvoll. Voice-Anfragen wie "Wann hat [Name] geöffnet?" oder "Wie komme ich zu [Name]?" werden von AI-Assistants bevorzugt mit Speakable-markierten Inhalten beantwortet.

Wie misst man den Erfolg von Speakable-Markup?

Direktes Tracking von Speakable-Zitationen ist mit Standardanalytics nicht möglich. Folgende indirekte Messmethoden sind hilfreich:

Google Search Console – Voice Search Filter: In der GSC-Filterung nach Gerät kann zwischen "Desktop", "Mobile" und "Tablet" unterschieden werden. Voice-Suchanfragen auf Smart Speakern (Google Home) erscheinen als Desktop-Aufrufe. Ein Anstieg von Desktop-Impressions nach Speakable-Implementierung kann ein Indikator sein.

Brand Monitoring: Speakable erhöht die Wahrscheinlichkeit, dass der Unternehmensname in AI-Antworten genannt wird – auch ohne Klick auf die Website. Brand-Monitoring-Tools wie Mention oder Brandwatch können AI-Erwähnungen trackbar machen.

Direktes Testen: Mit einem deutschen Sprachassistenten (Google Home, Siri, Alexa) direkt Fragen stellen, die Speakable-Inhalte der eigenen Website beantworten sollten. Erscheint die Website als Quelle? Wird die Antwort korrekt vorgelesen?

Fazit: Speakable als Teil der Schema-Strategie

Speakable Schema-Markup ist eine der effektivsten Maßnahmen, um AI-Systemen explizit mitzuteilen, welche Inhalte für die Sprachausgabe geeignet sind. Die wichtigsten Punkte:

CSS-Selektor-Methode für stabile und wartbare Implementierung verwenden
40-120 Wörter pro Speakable-Passage als Zielgröße für deutschsprachige Inhalte
Eigenständigkeit testen: Passage muss ohne Kontext verständlich sein
In @graph-Pattern integrieren für konsistentes Schema-Markup
Mit FAQPage-Schema kombinieren für maximale AI-Signaldichte
Alle vier Voice-Plattformen (Google, Apple, Amazon, Perplexity) profitieren von Speakable
Regelmäßig mit Google Rich Results Test validieren

Erweitern Sie Ihre Schema-Strategie mit dem vollständigen Schema-Audit: GEO-Analyse starten.