von Björn Fry
zuletzt bearbeitet: 22.07.2024
Für die Suchmaschinenoptimierung eines Textes kommt es darauf an, zur Suchintention der Zielgruppe passende Keywords auszuwählen und sinnvoll in einen Beitrag einzubauen.
So die Theorie.
In der SEO-Praxis stellt sich dann aber die Frage, wie häufig denn nun ein bestimmtes Keyword / ein Suchbegriff tatsächlich im Text auftauchen soll. Wo soll er in der Überschrift stehen? In wie vielen Überschriften soll er zu finden sein? Und wie häufig muss das exakte Keyword (ohne Bindewörter) auf der Webseite vorkommen?
Um das Maximum an SEO-Potenzial aus jedem Text rauszuholen, ohne uns des „Keyword Stuffings“ schuldig zu machen und damit gegen die Spamrichtlinien von Google zu verstoßen, braucht es natürlich mehr als ein gutes Bauchgefühl. Es braucht Daten.
Das konkrete Ziel der von uns durchgeführten Datenerhebung und Analyse war es, möglichst relevante Daten zur – aus SEO-Sicht – korrekten Nutzung von Keywords in Texten zu erhalten. Wir wollten prüfen, wo und wie häufig thematisch passende Suchbegriffe wirklich in einem Text auftauchen dürfen, um es auf die Spitzenplätze der SERPs zu schaffen.
Im Idealfall sollte sich aus den Ergebnissen der Analyse – überspitzt gesagt – eine Blaupause zum Keyword-Einsatz ableiten lassen. Selbst unter der Prämisse, dass es keine „Zauberformel“ für den perfekten SEO-Text geben kann, erhofften wir uns aber zumindest eine Zusammenfassung wichtiger Eckpunkte. Diese sollten auch anderen SEOs als Orientierung für eigene Optimierungen dienen.
Als Basis für unsere Untersuchung haben wir das Keyword-Set herangezogen, auf dessen Grundlage regelmäßig das Ranking für die iBusiness Top 100 SEO-Liste ermittelt wird. Dieses Keyword-Set umfasst insgesamt 446 SEO-relevante Suchbegriffe und wurde 2019 vom SEO-Toolanbieter XOVI definiert.
In unsere Analyse haben wir all die Webseiten einbezogen, die im Zeitraum der Datenerhebung (KW24 / Juni 2024) für mindestens eines der Keywords eine Platzierung in den Top 20 der Google-Suchergebnisse erreichten. Sie waren also bei einer Suchanfrage zum entsprechenden Keyword mindestens auf der zweiten Seite zu finden.
Daraus ergeben sich insgesamt rund 9.000 untersuchte Einzelrankings der jeweiligen Landing Pages. In Summe wurden im Laufe der Analyse 383.560 Datenpunkte erfasst.
Die für die Analyse verwendeten Daten wurden wie folgt erhoben und verarbeitet:
*1 Klassische Problemstellungen, bei denen *.innerText keinen Inhalt zurückgibt, haben wir mitigiert. Dies geschieht z.B. bei Elementen, die beim Aufrufen der Seite nicht gerendert werden, etwa wegen existierender CSS-Regeln à la “content-visibility: auto”
Bei der Betrachtung der Ergebnisse fokussieren wir uns nachfolgend besonders auf die ersten drei Plätze der SERPs. Eine Platzierung unter diesen Top 3-Suchergebnissen wird im SEO-Bereich als gut und besonders erstrebenswert erachtet. Das volle Set der Top 20-Suchergebnisse wird später nochmal aufgegriffen – zuerst wollten wir uns darauf fokussieren, welche Gemeinsamkeiten / Unterschiede die „Gewinner-Seiten“ aufweisen.
Bei allen Angaben handelt es sich um Durchschnittswerte, sofern dies nicht anders angegeben ist.
Für die Top 3-Suchergebnisse konnten wir feststellen, dass das Thema des Keywords in ziemlich exakt jeder dritten <h2>-Headline zu finden war. In 33 % aller Fälle enthielt die <h2> eine Keyword-nahe Formulierung oder ein Synonym des jeweiligen Keywords, für das die Seite bei Google rankte.
Wurden die Seiten innerhalb der Top 3-Suchergebnisse aktiv auf das jeweilige Keyword optimiert, so zeigte sich im Rahmen der Analyse, dass ca. 50 % dieser <h2>-Headlines das Thema des Keywords beinhalteten. Als „aktive Optimierung“ wurden alle Fälle gewertet, in denen für das Keyword auch ein 1:1 String-Matching im Title Tag der Seite vorlag.
Interessant ist, dass sich der Durchschnittswert für das Keyword-Thema ziemlich exakt auf die Hälfte aller <h2>-Überschriften beläuft. Auf den Spitzenplätzen der SERPs herrscht hier also eine „kompetitive Balance“ zwischen dem Bedarf nach einer aktiven Optimierung und der unterschwelligen Sorge, es mit den Keywords vielleicht doch zu übertreiben.
Ein „exact match“, bei dem das jeweilige Keyword exakt so in einer <h2>-Headline zu lesen war, gab es in etwa jeder vierten Überschrift. Über all die Seiten betrachtet, die für ein Keyword auf den Top 3-Suchergebnissen rankten, war dieses exakte Keyword in 23 % aller <h2>-Überschriften zu finden. Hier fokussierten wir uns erneut auf die Texte, die aktiv auf das jeweilige Keyword optimiert wurden.
Dabei wollten wir etwas mehr ins Detail gehen. Denn natürlich ist es in der Regel deutlich einfacher, kurze Keywords von einem Wort Länge in eine Überschrift zu verbauen. Also schlüsselten wir die Ergebnisse zusätzlich noch nach der Wortlänge der Suchbegriffe auf.
Das Ergebnis:
Wenig verwunderlich fanden sich sehr kurze Keywords entsprechend häufig wieder: Ganze 29,47 % aller Top 3-Suchergebnisse zu Keywords, die genau ein Wort umfassten, enthielten den jeweiligen Begriff – also fast jede dritte <h2>-Headline.
Prozentual nur auf dem zweiten Platz, in den Ergebnissen aber am häufigsten vertreten: Keywords mit zwei Begriffen zeigten sich in 21,99 % der Top 3-Suchergebnisse in exakter Reihenfolge in den Überschriften.
In 15,84 % aller Fälle gab es Keywords mit drei Worten Umfang in exakter Abfolge zu lesen, dann folgt ein Einbruch – Long Tail-Keywords, die vier oder mehr Begriffe umfassen, sind in „Reinkultur“ durchschnittlich nur in 2,78 % der Überschriften auszumachen.
Rein statistisch ist gerade der letzte Punkt interessant anzusehen, wenngleich er auch leicht nachvollziehbar ist. Da sehr lange Keywords in Überschriften unweigerlich sehr sperrig wirken, ist es kein Wunder, dass ihr Einsatz auch bei einer gezielten Optimierung auf ein Minimum reduziert wird.
Gleichzeitig ist festzuhalten, dass die Keywords nicht nur unterschiedlich viele Wörter enthalten, sondern auch unterschiedlich oft im gewählten KW-Set vertreten sind. Von den 446 untersuchten Keywords haben 46 KWs ein Wort Länge (10,31%), 278 KWs zwei Wörter Länge (62,33%), 107 KWs drei Wörter Länge (23,99%) und 15 vier oder mehr Wörter Länge (3,36%). Dies ändert nichts an den Ergebnissen, verschafft aber zusätzliche Perspektive.
In der Gesamtbetrachtung unterstreichen diese Ergebnisse sehr deutlich, wie präzise Google längst in der Lage ist, die Themen von Texten korrekt zu verstehen. So können sich SEO-Experten auf guten und schlüssig strukturierten Content fokussieren, ohne sich nervös an die „richtige“ Keyword-Dichte zu klammern.
Nachfolgend haben wir eine Reihe an nennenswerten Beobachtungen aus den Daten für interessierte Leser aufbereitet bzw. visualisiert.
Um einen möglichst ganzheitlichen Überblick zu erhalten, haben wir für diesen Abschnitt der Analyse die Daten zu den Top 20-Suchergebnispositionen jedes Keywords des Sets erhoben. Durch diese zusätzlichen Datenpunkte hofften wir, herausarbeiten zu können, was es wirklich für eine Position auf den Spitzenplätzen der SERPs braucht.
Dafür führten wir eine Korrelationsanalyse nach Pearson durch. Zur Erinnerung: Der Korrelationskoeffizient nach Pearson reicht als Maß von -1 - +1. +1 ist eine perfekte positive Korrelation (je mehr – desto mehr), -1 beschreibt eine perfekte negative Korrelation (je mehr – desto weniger).
Die Ergebnisse können Sie der nachfolgenden Tabelle entnehmen:
Dokumente ohne Keyword im <title> | Dokumente mit Keyword im <title> | Alle Dokumente | |
Anzahl Wörter im Main Content | -0,0819 | -0,0865 | -0,0824 |
Anzahl <h1>-<h6>, die Thema des Keywords enthalten (Embedding) | -0,0691 | -0,0619 | -0,0641 |
Anzahl <h1>-<h6> (Headlines) | -0,0830 | -0,0053 | -0,0577 |
Anzahl <dl>, <ol>, <ul> (Listen) | -0,0512 | -0,0422 | -0,0489 |
Anzahl <em>, die Thema des Keywords enthalten (Embedding) | -0,0479 | -0,0404 | -0,0453 |
Anzahl <em>, die Keyword oder Synonym enthalten (Lemma) | -0,0178 | -0,0998 | -0,0449 |
Anzahl <h2>, die Thema des Keywords enthalten (Embedding) | -0,0377 | -0,0726 | -0,0425 |
Anzahl <dl>, <ol>, <ul> (Listen), die Thema des Keywords enthalten (Embedding) | -0,0352 | -0,0562 | -0,0368 |
Anzahl <em>, die Keyword enthalten (String) | -0,0128 | -0,0859 | -0,0348 |
Anzahl Bilder mit Alt-Attribut | -0,0315 | -0,0242 | -0,0301 |
Anzahl <strong> (Fettschrift) | -0,0292 | -0,0173 | -0,0266 |
Anzahl <strong>, die Thema des Keywords enthalten (Embedding) | -0,0322 | -0,0165 | -0,0264 |
Anzahl <em> (Kursivschrift) | -0,0471 | 0,0154 | -0,0264 |
Anzahl <h1>, die Thema des Keywords enthalten (Embedding) | -0,0261 | -0,0576 | -0,0231 |
Anzahl Bild-Alt-Attribute, die Thema des Keywords enthalten (Embedding) | -0,0202 | -0,0204 | -0,0196 |
Term mit höchster Termfrequenz ist das Keyword | -0,0154 | -0,0636 | -0,0191 |
Term mit höchster WDF (Within Document Frequency) ist das Keyword | -0,0154 | -0,0636 | -0,0191 |
Anzahl <dl>, <ol>, <ul> (Listen), die Keyword enthalten (String) | -0,0310 | -0,0462 | -0,0189 |
Anzahl <table> (Tabellen) | -0,0125 | -0,0308 | -0,0156 |
Anzahl <h1> (Wichtigste Headline) | -0,0156 | -0,0049 | -0,0122 |
Anzahl <h2>, die Keyword oder Synonym enthalten (Lemma) | -0,0178 | -0,0411 | -0,0106 |
Anzahl <table>, die Keyword oder Synonym enthalten (Lemma) | -0,0065 | -0,0271 | -0,0104 |
Anzahl <dl>, <ol>, <ul> (Listen), die Keyword oder Synonym enthalten (Lemma) | -0,0103 | -0,0381 | -0,0098 |
Anzahl <h2> (Headline zweiter Ordnung) | -0,0344 | 0,0236 | -0,0086 |
Anzahl <table>, die Keyword enthalten (String) | 0,0033 | -0,0247 | -0,0075 |
Anzahl <h2>, die Keyword enthalten (String) | -0,0202 | -0,0341 | -0,0072 |
Anzahl <strong>, die Keyword enthalten (String) | -0,0127 | -0,0186 | -0,0052 |
Anzahl <table>, die Thema des Keywords enthalten (Embedding) | 0,0084 | -0,0286 | -0,0018 |
Title Tag enthält Thema des Keywords (Embedding) | -0,0101 | 0,0000 | 0,0019 |
Anzahl <h1>-<h6>, die Keywords oder Synonym enthalten (Lemma) | 0,0021 | -0,0258 | 0,0057 |
Anzahl <strong>, die Keyword enthalten (String) | -0,0061 | -0,0035 | 0,0060 |
Anzahl <h1>-<h6>, die Keyword enthalten (String) | -0,0063 | -0,0138 | 0,0084 |
Anzahl Bild-Alt-Attribute, die Keyword oder Synonym enthalten (Lemma) | 0,0117 | 0,0116 | 0,0165 |
Anzahl Bild-Alt-Attribute, die Keyword enthalten (String) | 0,0066 | 0,0247 | 0,0190 |
Anzahl <h1>, die Keyword enthalten (String) | -0,0035 | -0,0110 | 0,0193 |
Anzahl <h1>, die Keyword oder Synonym enthalten (Lemma) | 0,0105 | -0,0133 | 0,0206 |
Title Tag enthält Keyword oder Synonym (Lemma) | -0,0019 | -0,0108 | 0,0215 |
Title Tag enthält Keyword (String) | 0,0000 | 0,0000 | 0,0271 |
Mit Blick auf die Frage, inwiefern ausgewählte OnPage-Features mit der SEO-Performance einzelner Beiträge korrelieren, fällt auf, dass nur wenig auffällt. Anhand der Werte wird sogar deutlich, dass innerhalb der von uns betrachteten Daten nur sehr schwache Korrelationen festzustellen sind (alle Ergebnisse von 0,0 – 0,1).
Eine kleine Besonderheit konnten wir im Rahmen der Analyse jedoch ausmachen: Sowohl in den Top 20-Suchergebnispositionen als auch in den Top 3 ist das exakte Keyword im Title Tag ein echter Exot. Lediglich 21% der Top 3-Suchergebnisse enthielten das exakte Keyword im Title Tag. Dies war deutlich seltener als von uns erwartet und eine spannende Beobachtung zum Abschluss.
Anspruch der Analyse war es nicht, universell gültige Aussagen zu allen Suchergebnissen bereitzustellen. Das verwendete Keyword-Set ist dafür auch nicht geeignet und kann folgerichtig keine statistisch signifikanten Ergebnisse liefern.
Wir haben uns für dieses Set entschieden, da es für unsere explorative Analyse absolut ausreichend war. Gleichzeitig konnten wir so unnötige Aufwände für das eigenständige Zusammenstellen und Auswerten eines Keyword-Sets, das kein Übergewicht in bestimmten Themenfeldern oder Suchvolumen-Gruppen aufweist, vermeiden.
Durch den Fokus auf das Thema SEO als Grundlage konnten wir einen nach unserer Auffassung hinreichend kompetitiven Markt mit eher hoher Keywordfrequenz analysieren. Ähnliche Voraussetzungen für eine Untersuchung wären nach unserer Einschätzung auch bei Themen wie Versicherung, Kreditvergleich und artverwandten Bereichen zu erwarten.
Am Ende blieben die Ergebnisse der Analyse bedauerlicherweise etwas hinter den Erwartungen zurück. Eine statistische Signifikanz der Ergebnisse unserer Korrelationsanalyse war leider nicht gegeben, sodass die wenigen Beobachtungen in diesem Bereich am Ende des Tages eher anekdotischen Charakter haben.
Die eingangs als Ziel formulierte „Blaupause zum Keyword-Einsatz“ lässt sich aus den vorliegenden Daten so nicht konstruieren – zumindest nicht für alle HTML-Elemente.
Mit Blick auf die Nutzung von Keywords in Überschriften – gerade in <h2>-Headlines – nehmen wir allerdings einige interessante Erkenntnisse mit. Diese decken sich gleichzeitig auch mit unseren bisherigen Erfahrungen aus der SEO-Praxis.
Während der Analyse legten wir einen großen Fokus auf die Überschriften innerhalb der Texte. Dabei ist selbstverständlich zu berücksichtigen, dass die kritischen Inhalte eines (guten) Textes sich zwischen den Überschriften abspielen. Hier könnte es sich sicherlich lohnen, die Textinhalte – bei eventuellen Folgeanalysen – noch detaillierter zu betrachten.
Tel.: +49 (0) 201 8944-6
info@koch-essen.de
Alfredstraße 61, 45130 Essen