Wie ich SEO-Tests aufsetze: Mein Standardprotokoll
Warum Methodik wichtig ist
SEO ist ein Feld voller anekdotischer Evidenz. Jemand ändert seinen Title Tag, sieht eine Rankingverbesserung, und schreibt darüber als wäre es ein Gesetz.
Das Problem: SEO-Rankings hängen von hunderten Variablen ab. Ohne kontrolliertes Setup kann man keine kausalen Schlüsse ziehen – nur Korrelationen beobachten.
Auf seo-geek.de halte ich mich an ein Standardprotokoll. Das macht die Studien zwar nicht perfekt, aber zumindest transparent und reproduzierbar.
Das Protokoll
1. Hypothese formulieren (vor der Messung)
Jeder Test beginnt mit einer falsifizierbaren Hypothese:
Wenn [Intervention X], dann [Metrik Y verändert sich um Betrag Z],
weil [Mechanismus M].
Beispiel:
Wenn ich auf Seiten mit < 2 internen Links 0 3 interne Links ergänze, dann steigt die CTR um ≤ 10% binnen 90 Tagen, weil Googlebot die Seiten häufiger crawlt und die topische Relevanz steigt.
2. Baseline definieren
Vor der Intervention: 28–90 Tage Baseline-Daten aus GSC exportieren. Je mehr Datenpunkte, desto besser das Signal-Rausch-Verhältnis.
Minimale Datenbasis pro URL: 50 Impressionen im Beobachtungszeitraum.
3. Segmentierung
Welche URLs gehören zur Interventionsgruppe, welche zur Kontrollgruppe?
Wichtig: Kontrollgruppe und Interventionsgruppe sollten vergleichbar sein – gleiche Themenbreite, ähnliche Seitentiefe, ähnliche Impression-Baseline.
4. Intervention sauber dokumentieren
Datum der nderung, Art der nderung, Umfang. Keine parallelen nderungen in derselben Periode.
5. Wartezeit
Minimum: 28 Tage nach Intervention. Idealerweise 60–90 Tage, um Googles Crawl- und Indexierungslatenz zu überbrücken.
6. Auswertung
Δ = (Metrik nach - Metrik vor) / Metrik vor 100%
Vergleich Interventions- vs. Kontrollgruppe. Sind die Unterschiede größer als natürliches Rauschen?
Wann gilt ein Effekt als relevant: Wenn die Interventionsgruppe min. 15% besser abschneidet als die Kontrollgruppe.
Was dieses Protokoll nicht leistet
- Keine statistische Signifikanz: SEO-Tests haben meist zu wenige URLs/Datenpunkte für p-Werte.
- Keine Kausalität: Nur Korrelation beobachtbar.
- Kein Ausschluss externer Faktoren: Google-Updates, Saisonalität, Wettbewerber können alle Effekte überlagern.
Ich weise in jeder Studie explizit auf Limitationen hin.