27.01.2015

Doppelter Inhalt, auf Englisch Duplicate Content, ist einer der Hauptfaktoren, der die Performance einer Website in den Google-Suchergebnissen negativ beeinflusst. Doppelter Content entsteht, wenn der gleiche Inhalt auf unterschiedlichen URLs vorhanden ist. Doch wo versteckt sich Doppelter Content am häufigsten? Wir stellen unsere Top 10 für versteckten Duplicate Content vor.

 

Mit www. und ohne www.

Webseiten sind oftmals systembedingt mit www. und ohne www. abrufbar. Dies führt zu doppelten Inhalten. Die Seiten www.clicks.de und clicks.de sind technisch gesehen zwei unterschiedliche Seiten, da sie verschiedene URLs haben. Das www. wird als Subdomain bezeichnet. Die Domain ist in dem Fall clicks.de und www.clicks.de ist der Hostname.

Um Google nicht zu verwirren, muss man sich für eine Variante entscheiden und die „falschen“ URLs per 301-Weiterleitung in der .htaccess-Datei dementsprechend auf die jeweils korrekte Variante weiterleiten. Ob die Domain mit www. oder ohne www. gewählt wird, spielt keine Rolle für Google. Hauptsache, alle URLs der Webpräsenz entsprechen dem gleichen Schema. Clicks hat sich für www.clicks.de entschieden. Gibt der User im Browser clicks.de ein, wird er automatisch per 301-Weiterleitung auf die Seite www.clicks.de weitergeleitet. Zusätzlich kann die bevorzugte Variante in den Webmastertools eingestellt werden.

Doppelter Content durch index.php

Webseiten sind häufig sowohl unter www.beispiel.de als auch mit www.beispiel.de/index.php aufrufbar. Um dies zu vermeiden, sollte eine 301-Weiterleitung auf www.beispiel.de eingerichtet werden.

Seiten über HTTP und HTTPS erreichbar

Die Seiten http://www.beispiel.de/ und https://www.beispiel.de/ sind verschiedene URLs mit identischem, also doppeltem Content. Das Übertragungsprotokoll HTTPS (HyperText Transfer Protocol Secure) überträgt Daten im Netz in verschlüsselter Form. Auch hier sollte man sich allerdings für eine Variante entscheiden, die dann für die gesamte Domain gilt (Ausnahme bei Entscheidung für HTTP: Kaufabwicklung bei Shops und sonstige Bereiche, in denen der Nutzer besonders sensible Daten angeben muss. Hier muss HTTPS zum Einsatz kommen). HTTPS ist aber mittlerweile generell vorzuziehen, da Google im Webmaster Central Blog klar gemacht hat, dass die Verwendung von HTTPS positive Effekte auf Webseiten-Rankings hat.

Filtermöglichkeiten

Filter werden oft in Online-Shops eingesetzt, um die Produkte nach bestimmten Attributen wie Preis, Größe, Farbe etc. zu filtern. Mit jedem Filter wird eine neue URL generiert, eine sogenannte Parameter-URL. Diese URL enthält ein Fragezeichen. Wird beispielsweise nach der Farbe blau gefiltert, könnte die URL wie folgt aussehen: www.beispiel.de/?farbe= blau.
Bei einer Filterung ändern sich die angezeigten Produkte zwar, aber die Produktbeschreibungen sind oftmals identisch und es liegt somit wieder doppelter Inhalt vor.
Es wäre viel zu aufwendig, für jede Filtermöglichkeit eine individuelle Produktbeschreibung zu verfassen, daher sollte auf Filterseiten bzw. Parameter-URLs automatisiert die Meta-Angabe <meta name="robots" content="NOINDEX,FOLLOW" /> gesetzt werden.

Paginierungsseiten

In Online-Shops werden die Produkte häufig auf mehreren Seiten dargestellt, um langes Scrollen zu vermeiden.

Die paginierten Seiten sind identisch aufgebaut und enthalten fast immer die gleichen Produktbeschreibungen. Daher sollten die Paginierungsseiten ebenfalls auf <NoIndex, Follow> gesetzt werden, um Doppelten Content zu vermeiden.

Shopsuche

Wird über die Suchfunktion nach einem Begriff gesucht, wird durch das Suchergebnis eine neue URL erzeugt, die allerdings auch nur an anderer Stelle bereits vorhandenen Content enthält und somit doppelten Inhalt verursacht. Daher sollten Suchseiten in aller Regel deindexiert werden.

Groß- und Kleinschreibung in URLs

Die Seiten www.beispiel.de und www.Beispiel.de gelten als zwei verschiedene URLs, weshalb man sich auch hier auf eine Variante festlegen sollte. Die Kleinschreibung ist in der Regel einfacher umsetzbar und sollte daher im Zweifel bevorzugt werden. Die entsprechenden Einstellungen können in den Servereinstellungen vorgenommen werden.

Druckversion

Wird der Inhalt einer Webseite als Druckversion zur Verfügung gestellt, entsteht eine neue URL, die aber lediglich den Inhalt der entsprechenden Website enthält. Dabei handelt es sich – Überraschung! – um doppelten Inhalt. Durch das Setzen eines Canonical-Tags in den Meta-Angaben der Druckversionsseite auf den Originalinhalt kann dies umgangen werden.

Neue URL-Struktur durch Domainumzug

Bei einem Domainumzug erhält die neue Domain eine neue URL-Struktur. Die alten Webseiten sollten daher per 301-Weiterleitung auf die entsprechenden neuen Webseiten geleitet werden.

Veröffentlichungen von Beiträgen

Werden Beiträge extern veröffentlicht, kann es vorkommen, dass diese auf mehreren URLs publiziert werden. Veröffentlicht ein Webseitenbetreiber einen Beitrag auf www.beispiel.de/blog und auf www.testseite.de/magazin, liegt doppelter Content vor. Mit dem Setzen eines Canonical-Tags auf die Originalquelle kann dieses Problem behoben werden.

Fazit

Doppelter Content entsteht immer, wenn auf mehreren URLs der gleiche Inhalt ausgespielt wird. Die Fehler, die zu doppeltem Content führen, sind häufig dieselben, was den Vorteil hat, dass Lokalisierung und zukünftige Vermeidung verhältnismäßig einfach sind. Dabei tritt Doppelter Content am häufigsten auf der eigenen Seite auf, aber auch auf externen Webseiten ist Duplicate Content möglich.
Durch den geschickten Einsatz von 301-Weiterleitungen, der Meta-Angabe <meta name="robots" content="NOINDEX,FOLLOW" /> und dem Canonical-Tag kann doppelter Inhalt erfolgreich vermieden werden.

 

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.