Koch Essen

SEO & Keyword Stuffing – Eine empirische Analyse

von Björn Fry

zuletzt bearbeitet: 22.07.2024

Keyword Stuffing und SEO Header

Für die Suchmaschinenoptimierung eines Textes kommt es darauf an, zur Suchintention der Zielgruppe passende Keywords auszuwählen und sinnvoll in einen Beitrag einzubauen.

So die Theorie.

In der SEO-Praxis stellt sich dann aber die Frage, wie häufig denn nun ein bestimmtes Keyword / ein Suchbegriff tatsächlich im Text auftauchen soll. Wo soll er in der Überschrift stehen? In wie vielen Überschriften soll er zu finden sein? Und wie häufig muss das exakte Keyword (ohne Bindewörter) auf der Webseite vorkommen?

Um das Maximum an SEO-Potenzial aus jedem Text rauszuholen, ohne uns des „Keyword Stuffings“ schuldig zu machen und damit gegen die Spamrichtlinien von Google zu verstoßen, braucht es natürlich mehr als ein gutes Bauchgefühl. Es braucht Daten.

Ziel der Analyse #

Das konkrete Ziel der von uns durchgeführten Datenerhebung und Analyse war es, möglichst relevante Daten zur – aus SEO-Sicht – korrekten Nutzung von Keywords in Texten zu erhalten. Wir wollten prüfen, wo und wie häufig thematisch passende Suchbegriffe wirklich in einem Text auftauchen dürfen, um es auf die Spitzenplätze der SERPs zu schaffen.

Im Idealfall sollte sich aus den Ergebnissen der Analyse – überspitzt gesagt – eine Blaupause zum Keyword-Einsatz ableiten lassen. Selbst unter der Prämisse, dass es keine „Zauberformel“ für den perfekten SEO-Text geben kann, erhofften wir uns aber zumindest eine Zusammenfassung wichtiger Eckpunkte. Diese sollten auch anderen SEOs als Orientierung für eigene Optimierungen dienen.

Die Datenbasis #

Als Basis für unsere Untersuchung haben wir das Keyword-Set herangezogen, auf dessen Grundlage regelmäßig das Ranking für die iBusiness Top 100 SEO-Liste ermittelt wird. Dieses Keyword-Set umfasst insgesamt 446 SEO-relevante Suchbegriffe und wurde 2019 vom SEO-Toolanbieter XOVI definiert.

In unsere Analyse haben wir all die Webseiten einbezogen, die im Zeitraum der Datenerhebung (KW24 / Juni 2024) für mindestens eines der Keywords eine Platzierung in den Top 20 der Google-Suchergebnisse erreichten. Sie waren also bei einer Suchanfrage zum entsprechenden Keyword mindestens auf der zweiten Seite zu finden.

Daraus ergeben sich insgesamt rund 9.000 untersuchte Einzelrankings der jeweiligen Landing Pages. In Summe wurden im Laufe der Analyse 383.560 Datenpunkte erfasst.

Ablauf der Datenerhebung #

Die für die Analyse verwendeten Daten wurden wie folgt erhoben und verarbeitet:

  • Download der Top 20 SERPs für alle Keywords über die SISTRIX API
  • Aufruf aller in diesen SERPs enthaltenen Dokumente mit einem aktuellen Chromium-Browser
  • Extraktion von HTML-Elementen und Seiteninhalten per JavaScript, direkt im Browser (*.querySelectorAll, *.innerText, Intl.Segmenter, etc.) *1
  • Matching von Keywords und Headlines nach mehreren Verfahren:
    • Einfacher Stringvergleich
    • Lemmatisierung / Stopword-Removal
    • Cosine Similarity von Embeddings

*1 Klassische Problemstellungen, bei denen *.innerText keinen Inhalt zurückgibt, haben wir mitigiert. Dies geschieht z.B. bei Elementen, die beim Aufrufen der Seite nicht gerendert werden, etwa wegen existierender CSS-Regeln à la “content-visibility: auto”

Ergebnisse der Analyse #

Bei der Betrachtung der Ergebnisse fokussieren wir uns nachfolgend besonders auf die ersten drei Plätze der SERPs. Eine Platzierung unter diesen Top 3-Suchergebnissen wird im SEO-Bereich als gut und besonders erstrebenswert erachtet. Das volle Set der Top 20-Suchergebnisse wird später nochmal aufgegriffen – zuerst wollten wir uns darauf fokussieren, welche Gemeinsamkeiten / Unterschiede die „Gewinner-Seiten“ aufweisen.

Bei allen Angaben handelt es sich um Durchschnittswerte, sofern dies nicht anders angegeben ist.

Beobachtung 1: Keyword-Thema in H2-Überschriften #

Kuchendiagramm zu Keyword-Thema in H2-Überschriften
 

Für die Top 3-Suchergebnisse konnten wir feststellen, dass das Thema des Keywords in ziemlich exakt jeder dritten <h2>-Headline zu finden war. In 33 % aller Fälle enthielt die <h2> eine Keyword-nahe Formulierung oder ein Synonym des jeweiligen Keywords, für das die Seite bei Google rankte. 

Beobachtung 2: „SEO-Sättigung“ von H2-Überschriften #

Kuchendiagramm zur maximalen Menge an Keywords in H2-Überschriften
 

Wurden die Seiten innerhalb der Top 3-Suchergebnisse aktiv auf das jeweilige Keyword optimiert, so zeigte sich im Rahmen der Analyse, dass ca. 50 % dieser <h2>-Headlines das Thema des Keywords beinhalteten. Als „aktive Optimierung“ wurden alle Fälle gewertet, in denen für das Keyword auch ein 1:1 String-Matching im Title Tag der Seite vorlag.

Interessant ist, dass sich der Durchschnittswert für das Keyword-Thema ziemlich exakt auf die Hälfte aller <h2>-Überschriften beläuft. Auf den Spitzenplätzen der SERPs herrscht hier also eine „kompetitive Balance“ zwischen dem Bedarf nach einer aktiven Optimierung und der unterschwelligen Sorge, es mit den Keywords vielleicht doch zu übertreiben.

Beobachtung 3: Exakte Keywords in H2-Überschriften #

Kuchendiagramm zu exakten Keywords in H2-Überschriften
 

Ein „exact match“, bei dem das jeweilige Keyword exakt so in einer <h2>-Headline zu lesen war, gab es in etwa jeder vierten Überschrift. Über all die Seiten betrachtet, die für ein Keyword auf den Top 3-Suchergebnissen rankten, war dieses exakte Keyword in 23 % aller <h2>-Überschriften zu finden. Hier fokussierten wir uns erneut auf die Texte, die aktiv auf das jeweilige Keyword optimiert wurden.

Dabei wollten wir etwas mehr ins Detail gehen. Denn natürlich ist es in der Regel deutlich einfacher, kurze Keywords von einem Wort Länge in eine Überschrift zu verbauen. Also schlüsselten wir die Ergebnisse zusätzlich noch nach der Wortlänge der Suchbegriffe auf.

Das Ergebnis: 

Wenig verwunderlich fanden sich sehr kurze Keywords entsprechend häufig wieder: Ganze 29,47 % aller Top 3-Suchergebnisse zu Keywords, die genau ein Wort umfassten, enthielten den jeweiligen Begriff – also fast jede dritte <h2>-Headline.

Prozentual nur auf dem zweiten Platz, in den Ergebnissen aber am häufigsten vertreten: Keywords mit zwei Begriffen zeigten sich in 21,99 % der Top 3-Suchergebnisse in exakter Reihenfolge in den Überschriften.

In 15,84 % aller Fälle gab es Keywords mit drei Worten Umfang in exakter Abfolge zu lesen, dann folgt ein Einbruch – Long Tail-Keywords, die vier oder mehr Begriffe umfassen, sind in „Reinkultur“ durchschnittlich nur in 2,78 % der Überschriften auszumachen. 

Rein statistisch ist gerade der letzte Punkt interessant anzusehen, wenngleich er auch leicht nachvollziehbar ist. Da sehr lange Keywords in Überschriften unweigerlich sehr sperrig wirken, ist es kein Wunder, dass ihr Einsatz auch bei einer gezielten Optimierung auf ein Minimum reduziert wird. 

Gleichzeitig ist festzuhalten, dass die Keywords nicht nur unterschiedlich viele Wörter enthalten, sondern auch unterschiedlich oft im gewählten KW-Set vertreten sind. Von den 446 untersuchten Keywords haben 46 KWs ein Wort Länge (10,31%), 278 KWs zwei Wörter Länge (62,33%), 107 KWs drei Wörter Länge (23,99%) und 15 vier oder mehr Wörter Länge (3,36%). Dies ändert nichts an den Ergebnissen, verschafft aber zusätzliche Perspektive.

In der Gesamtbetrachtung unterstreichen diese Ergebnisse sehr deutlich, wie präzise Google längst in der Lage ist, die Themen von Texten korrekt zu verstehen. So können sich SEO-Experten auf guten und schlüssig strukturierten Content fokussieren, ohne sich nervös an die „richtige“ Keyword-Dichte zu klammern.

Interessante Grafiken zu den Top 3-Suchergebnissen #

Nachfolgend haben wir eine Reihe an nennenswerten Beobachtungen aus den Daten für interessierte Leser aufbereitet bzw. visualisiert.

Balkendiagramm mit Angaben zu H2-Headlines mit Keyword-Thema in Prozent
 
Balkendiagramm mit Angaben zur Anzahl der H2-Headlines im Text
 
Balkendiagramm mit Angaben zur Anzahl der Wörter im Text je H2-Headline
 

Relevanz OnPage-Faktoren für Ranking – Korrelationsanalyse  #

Um einen möglichst ganzheitlichen Überblick zu erhalten, haben wir für diesen Abschnitt der Analyse die Daten zu den Top 20-Suchergebnispositionen jedes Keywords des Sets erhoben. Durch diese zusätzlichen Datenpunkte hofften wir, herausarbeiten zu können, was es wirklich für eine Position auf den Spitzenplätzen der SERPs braucht.

Dafür führten wir eine Korrelationsanalyse nach Pearson durch. Zur Erinnerung: Der Korrelationskoeffizient nach Pearson reicht als Maß von -1 - +1. +1 ist eine perfekte positive Korrelation (je mehr – desto mehr), -1 beschreibt eine perfekte negative Korrelation (je mehr – desto weniger). 

Die Ergebnisse können Sie der nachfolgenden Tabelle entnehmen:

 Dokumente ohne Keyword im <title>Dokumente mit Keyword im <title>Alle Dokumente
Anzahl Wörter im Main Content

-0,0819

-0,0865

-0,0824

Anzahl <h1>-<h6>, die Thema des Keywords enthalten (Embedding)

-0,0691

-0,0619

-0,0641

Anzahl <h1>-<h6> (Headlines)

-0,0830

-0,0053

-0,0577

Anzahl <dl>, <ol>, <ul> (Listen)

-0,0512

-0,0422

-0,0489

Anzahl <em>, die Thema des Keywords enthalten (Embedding)

-0,0479

-0,0404

-0,0453

Anzahl <em>, die Keyword oder Synonym enthalten (Lemma)

-0,0178

-0,0998

-0,0449

Anzahl <h2>, die Thema des Keywords enthalten (Embedding)

-0,0377

-0,0726

-0,0425

Anzahl <dl>, <ol>, <ul> (Listen), die Thema des Keywords enthalten (Embedding)

-0,0352

-0,0562

-0,0368

Anzahl <em>, die Keyword enthalten (String)

-0,0128

-0,0859

-0,0348

Anzahl Bilder mit Alt-Attribut

-0,0315

-0,0242

-0,0301

Anzahl <strong> (Fettschrift)

-0,0292

-0,0173

-0,0266

Anzahl <strong>, die Thema des Keywords enthalten (Embedding)

-0,0322

-0,0165

-0,0264

Anzahl <em> (Kursivschrift)

-0,0471

0,0154

-0,0264

Anzahl <h1>, die Thema des Keywords enthalten (Embedding)

-0,0261

-0,0576

-0,0231

Anzahl Bild-Alt-Attribute, die Thema des Keywords enthalten (Embedding)

-0,0202

-0,0204

-0,0196

Term mit höchster Termfrequenz ist das Keyword

-0,0154

-0,0636

-0,0191

Term mit höchster WDF (Within Document Frequency) ist das Keyword

-0,0154

-0,0636

-0,0191

Anzahl <dl>, <ol>, <ul> (Listen), die Keyword enthalten (String)

-0,0310

-0,0462

-0,0189

Anzahl <table> (Tabellen)

-0,0125

-0,0308

-0,0156

Anzahl <h1> (Wichtigste Headline)

-0,0156

-0,0049

-0,0122

Anzahl <h2>, die Keyword oder Synonym enthalten (Lemma)

-0,0178

-0,0411

-0,0106

Anzahl <table>, die Keyword oder Synonym enthalten (Lemma)

-0,0065

-0,0271

-0,0104

Anzahl <dl>, <ol>, <ul> (Listen), die Keyword oder Synonym enthalten (Lemma)

-0,0103

-0,0381

-0,0098

Anzahl <h2> (Headline zweiter Ordnung)

-0,0344

0,0236

-0,0086

Anzahl <table>, die Keyword enthalten (String)

0,0033

-0,0247

-0,0075

Anzahl <h2>, die Keyword enthalten (String)

-0,0202

-0,0341

-0,0072

Anzahl <strong>, die Keyword enthalten (String)

-0,0127

-0,0186

-0,0052

Anzahl <table>, die Thema des Keywords enthalten (Embedding)

0,0084

-0,0286

-0,0018

Title Tag enthält Thema des Keywords (Embedding)

-0,0101

0,0000

0,0019

Anzahl <h1>-<h6>, die Keywords oder Synonym enthalten (Lemma)

0,0021

-0,0258

0,0057

Anzahl <strong>, die Keyword enthalten (String)

-0,0061

-0,0035

0,0060

Anzahl <h1>-<h6>, die Keyword enthalten (String)

-0,0063

-0,0138

0,0084

Anzahl Bild-Alt-Attribute, die Keyword oder Synonym enthalten (Lemma)

0,0117

0,0116

0,0165

Anzahl Bild-Alt-Attribute, die Keyword enthalten (String)

0,0066

0,0247

0,0190

Anzahl <h1>, die Keyword enthalten (String)

-0,0035

-0,0110

0,0193

Anzahl <h1>, die Keyword oder Synonym enthalten (Lemma)

0,0105

-0,0133

0,0206

Title Tag enthält Keyword oder Synonym (Lemma)

-0,0019

-0,0108

0,0215

Title Tag enthält Keyword (String)

0,0000

0,0000

0,0271

Ergebnisse der Analyse insgesamt #

Mit Blick auf die Frage, inwiefern ausgewählte OnPage-Features mit der SEO-Performance einzelner Beiträge korrelieren, fällt auf, dass nur wenig auffällt. Anhand der Werte wird sogar deutlich, dass innerhalb der von uns betrachteten Daten nur sehr schwache Korrelationen festzustellen sind (alle Ergebnisse von 0,0 – 0,1). 

Eine kleine Besonderheit konnten wir im Rahmen der Analyse jedoch ausmachen: Sowohl in den Top 20-Suchergebnispositionen als auch in den Top 3 ist das exakte Keyword im Title Tag ein echter Exot. Lediglich 21% der Top 3-Suchergebnisse enthielten das exakte Keyword im Title Tag. Dies war deutlich seltener als von uns erwartet und eine spannende Beobachtung zum Abschluss.

Anmerkungen zur Datenqualität #

Anspruch der Analyse war es nicht, universell gültige Aussagen zu allen Suchergebnissen bereitzustellen. Das verwendete Keyword-Set ist dafür auch nicht geeignet und kann folgerichtig keine statistisch signifikanten Ergebnisse liefern. 

Wir haben uns für dieses Set entschieden, da es für unsere explorative Analyse absolut ausreichend war. Gleichzeitig konnten wir so unnötige Aufwände für das eigenständige Zusammenstellen und Auswerten eines Keyword-Sets, das kein Übergewicht in bestimmten Themenfeldern oder Suchvolumen-Gruppen aufweist, vermeiden.

Durch den Fokus auf das Thema SEO als Grundlage konnten wir einen nach unserer Auffassung hinreichend kompetitiven Markt mit eher hoher Keywordfrequenz analysieren. Ähnliche Voraussetzungen für eine Untersuchung wären nach unserer Einschätzung auch bei Themen wie Versicherung, Kreditvergleich und artverwandten Bereichen zu erwarten.

SEO und Keyword Stuffing - Ein Fazit #

Am Ende blieben die Ergebnisse der Analyse bedauerlicherweise etwas hinter den Erwartungen zurück. Eine statistische Signifikanz der Ergebnisse unserer Korrelationsanalyse war leider nicht gegeben, sodass die wenigen Beobachtungen in diesem Bereich am Ende des Tages eher anekdotischen Charakter haben. 

Die eingangs als Ziel formulierte „Blaupause zum Keyword-Einsatz“ lässt sich aus den vorliegenden Daten so nicht konstruieren – zumindest nicht für alle HTML-Elemente.

Mit Blick auf die Nutzung von Keywords in Überschriften – gerade in <h2>-Headlines – nehmen wir allerdings einige interessante Erkenntnisse mit. Diese decken sich gleichzeitig auch mit unseren bisherigen Erfahrungen aus der SEO-Praxis. 

  1. Bei aktiver Optimierung eines Textes kommen KWs deutlich häufiger in <h2>-Überschriften vor – verglichen mit einem nicht SEO-optimierten Text.
  2. Für eine Platzierung unter den Top 3-Suchergebnissen ist es mehr als ausreichend, das Thema des Keywords in jeder zweiten <h2>-Überschrift zu nennen.
  3. Exakte Keyword-Folgen sind in <h2>-Überschriften eher die Ausnahme als die Regel – sie tauchen in 23% der Headlines auf.
  4. Je mehr einzelne Wörter ein Keyword umfasst, desto seltener wird es „in Reinform“, also als exaktes Keyword, in den Überschriften genutzt.

Während der Analyse legten wir einen großen Fokus auf die Überschriften innerhalb der Texte. Dabei ist selbstverständlich zu berücksichtigen, dass die kritischen Inhalte eines (guten) Textes sich zwischen den Überschriften abspielen. Hier könnte es sich sicherlich lohnen, die Textinhalte – bei eventuellen Folgeanalysen – noch detaillierter zu betrachten.

Wir freuen uns auf Neues
Let’s talk about you.
Gemeinsam durchstarten.

Tel.: +49 (0) 201 8944-6
info@koch-essen.de
Alfredstraße 61, 45130 Essen