Zum Hauptinhalt springen

In der neunten Episode des Search Off the Records Podcasts erklärt Gary Illyes von Google, wie die Suchmaschine Duplicate Content auf einer Seite erkennt und welche Faktoren bei der Ermittlung eines kanonischen Dokuments berücksichtigt werden.

Kurz zusammengefasst arbeitet Google mit einem Hashwert des Contents (einer Prüfsumme). Den gesamten Content zu nutzen wäre zu ineffizient. Zur Ermittlung von Duplikaten werden die Hashwerte unterschiedlicher Dokumente miteinander verglichen. Die Navigation sowie Sidebars und Footer werden von der Auswertung ausgenommen.

Kanonische Dokumente sind für Google nicht nur Seiten, auf die ein Canonical-Tag verweist. Google verwendet mehr als 20 Signale, um ein kanonisches Dokument zu ermitteln und das Canonical Tag ist nur eins davon. Zu den weiteren Signalen gehören:

  • Page Rank
  • Status Code
  • Sitemap
  • HTTPS Protokoll
  • Und natürlich der Inhalt

Canonicals sind also weiter nur eine kleine Unterstützung im Kampf gegen Duplicate Content und keine Lösung. Bei Duplicate Content gilt: Vermeidung ist die beste Strategie. Auch in Zukunft werden wir also Seitenstrukturen, interne Verlinkung und die anderen Faktoren vereinfachen, um Duplicate Content nicht im Nachhinein einhegen zu müssen.

Das ist ein Artikel aus unserem Newsletter. Wenn Du jeden Dienstag Morgen schlauer werden möchtest, melde jetzt kostenfrei für den SEO-Newsletter an

Kurze, praxisnahe SEO-Tipps – maximal 1× pro Woche. Keine Werbung, kein Spam.

Deine Daten sind bei uns in guten Händen und werden ausschließlich für diesen Newsletter genutzt.