Geschrieben von

Canonicals

MarTech/AdTech

Auf den Punkt gebracht

  • Mit dem Canonical kann man Duplicate Content vermeiden
  • Das Canonical-Tag wurde 2009 eingeführt
  • Das Canonical-Element wird im HTML-Code oder im http-Header angegeben

Duplicate Content

Bevor wir tiefer in Canonicals eintauchen, ist es vorher wichtig zu wissen, was Duplicate Content ist. Bei Duplicate Content handelt es sich um doppelte Inhalte. Dabei spielt es keine Rolle, ob der Inhalt domainintern oder auf verschiedenen Domains doppelt anzutreffen ist. Grundsätzlich unterscheidet man 2 Arten von Duplicate Content:

  • Technisch: Dieser entsteht, wenn aus technischen Gründen doppelte URLs existieren
  • Inhaltlich: Dieser entsteht, wenn Texte 1:1 von einer auf die nächste URL kopiert werden

Ob doppelte Inhalte bewusst oder unbewusst generiert werden, in beiden Fällen kann Duplicate Content negative Auswirkungen auf das Ranking haben. Um negative Einflüsse zu vermeiden, kommt das Canonical-Tag ins Spiel.

Wozu Canonical einsetzen?

Wenn du Suchmaschinen bei doppelten Inhalten per Canonical die Original-URL mitteilst, können diese die bevorzugte URL crawlen, indexieren und alle SEO-Signale auf die eine Original-URL bündeln (“Multi-Positions-Link-Juice-Ventil”). Alle internen und externen Links werden somit der referenzierenden URL zugewiesen.

Wie schaut ein Canonical aus und wie wird dieses Tag eingebunden?

Das Tag kann auf 2 verschiedene Arten eingebunden werden: Im Head-Bereich des HTML-Dokuments oder über den http-Header.

Wenn man das Canonical im Head-Bereich platzieren will, so ist dieser folgendermaßen aufgebaut:

<link rel="canonical" href="https://www.demirjasarevic.com/canonicals/">

Wenn man das Canonical per http-Header platzieren will, so ist dieser folgendermaßen aufgebaut:

Link: <link https://www.demirjasarevic.com/canonicals/>; rel="canonical"

Anwendungsfälle

Selbstverweis

Um Duplicate Content zu vermeiden, empfiehlt Google einen Canonical auf sich selbst. Durch den selbstreferenzierenden Verweis, weiß Google, dass es sich bei der URL um das Original handelt. Kopien können dadurch über das URL-Muster besser und schneller identifiziert werden. So fällt es dem Bot leichter, die Crawlingkapazität zu steuern.

Am 11. Juni hatte jedoch Google in einem Webmaster Hangout auch erwähnt, dass ein Selbstverweis nicht zwingend notwendig ist. Canonicals seien lediglich eine Hilfe für Google, die Original-URL zu wählen. Vor allem wenn die URL auch über diverse Parameter aufgerufen werden kann, können selbstverweisende Canonicals Google die Arbeit erleichtern. Da Google aber verschiedene Quellen heranzieht, um die Caninical-URL zu bestimmen, sind Self-Canonicals keine Pflicht.

Gleicher Inhalt auf mehreren URLs

Viele CMS- und Shop-Systeme erzeugen bei Beitrags- oder Produktseiten zahlreiche Varianten. Diese Varianten unterscheiden sich nur in ihrer URL, nicht aber im Inhalt. So erzeugt Typo3 beispielsweise für eine URL folgende Varianten:

  • https://www.domain.com/unterseite
  • https://www.domain.com/unterseite/
  • https://www.domain.com/unterseite.html

Aber auch Online-Shops generieren manchmal für ein Produkt mehrere URLs:

  • https://www.shopdomain.com/produkt-1/
  • https://www.shopdomain.com/herren/produkt-1/
  • https://www.shopdomain.com/kategorie/produkt-1/

In beiden Fällen sollte eine bevorzugte URL gewählt werden. Alle anderen URLs zeigen bei Canonical auf die bevorzugte Version, wodurch Duplicate Content vermieden wird.

PDFs

Einige Webseiten bieten die Möglichkeit die HTML-Seite auch als PDF herunterzuladen. Da Bots PDFs ebenfalls crawlen und indexieren, kann hier Duplicate Content entstehen. In diesem Fall muss der Canonical per http-Header auf die HTML-Version zeigen.

Umzug auf https

Auch bei einem Umzug auf SSL können statt 301-Weiterleitungen Canonicals eingesetzt werden. Bevorzugt sollten Redirects eingerichtet werden. Sollte dies aus technischen Gründen nicht möglich sein, kann man auch alle http-Versionen per Canonical auf die https-Versionen zeigen lassen.

Fehler beim Canonical-Einsatz

Folgende Fehler sollten beim Einsatz von Canonicals vermieden werden:

  • Verwendung von relativen URLs: Canonicals sollten immer absolut angegeben werden.
  • Mehrere Canonicals auf einer Seite: Pro URL darf nur ein Canonical angegeben werden.
  • Falsche URL angeben.
  • Canonicals bei Domainumzug: Bei einem Domainumzug sollten immer 301-Weiterleitungen eingesetzt werden.
  • Noindex: Was passiert, wenn eine Index-Seite per Canonical auf eine Noindex-Seite zeigt? Die verlinkte Seite kommt aus dem Index. Wenn aber eine Noindex-Seite per Canonical auf eine Index-Seite verweist, fliegt die verlinkte Seite nicht aus dem Index.
  • Zielseite weicht inhaltlich ab: Sollte der Canonical auf eine URL zeigen, die inhaltlich vom Original abweicht, kann es sein, dass Google diese URLs dennoch indexiert. Falls 2 URLs inhaltlich komplett anders sind, sollte man lieber mit “noindex” arbeiten.

Weitere Hinweise zu Canonicals

  • Von Google werden nur Inhalte und interne Links der Canonical-URL berücksichtigt. Wurde bspw. Seite A als Canonical-Seite gewählt, Seite A1 hat aber 20 ausgehende Links, die Seite A nicht aufweist, werden diese Links nicht berücksichtigt.

Last modified: 28. Juli 2023