Duplicate Content
Duplicate Content (engl. "duplizierter Inhalt") bezeichnet laut Google "umfangreiche Contentblöcke, die anderem Content auf derselben oder einer anderen Domain entsprechen oder auffällig ähneln." [1]
Entstehung
Duplicate Content entsteht natürlich durch Plagatieren. Das ist aber nicht die Hauptursache. Häufig sind technische Ursachen für die Entstehung identischer Inhalte verantwortlich, wie z.B. [2]
- eine Website ist mit und ohne www erreichbar
- eine Website ist per http und https erreichbar
- Seiteninhalte werden zusätzlich in einer separaten Druckversion angeboten
- Seiteninhalte werden zusätzlich in einer auf mobile Endgeräte optimierten Version angeboten
- Seiteninhalte sind über Kategorien, Tags, Archive etc. erreichbar (ein häfiges Problem bei Blogs)
Nach Aussage von Matt Cutts, Leiter des Webspam-Teams bei Google und damit auch verantwortlich für die Qualität der Suchergebnisse [3] wird Duplicate Content – da er dem User keinen Mehrwert bietet – geclustert und nur die nach Ansicht von Google relevanteste Quelle wird angezeigt. Lediglich offensichtlicher Missbrauch wird als Web-Spam abgestraft. [4]
Identifizierung
Im Internet gibt es verschiedene Tools, mit deren Hilfe man identische Inhalte aufspüren kann [5]
- Copyscape sucht anhand einer URL nach Plagiaten im Netz.
- Virante dto.
- Article Checker arbeitet nicht mit URLs, sondern mit Textfragmenten.
- Plagium: dto.
- Similar Page Checker ermittelt nach Eingabe zweier URLs den Grad an Übereinstimmung.
- Siteliner überprüft eine Website intern auf identische Inhalte hin.
Vermeidung
Seitenbetreibern stehen verschiedene Möglichkeiten zur Verfügung, um Duplicate Content möglichst zu vermeiden bzw. Google gegenüber deutlich zu machen, wie mit identischen Inhalten verfahren werden soll. [6] Hier eine Auswahl:
- Bevorzugte URL mithilfe des Attributs rel="canonical" angeben
- Bevorzugte URLs für identische Inhalte in einer Sitemap festlegen
- Verwendung von 301-Weiterleitungen für nicht kanonische URLs
- Verwendung des Attributs rel="nofollow" für bestimmte Links
- Angeben, wie mit dynamischen Parametern verfahren werden soll
- Kanonischen Link im HTTP-Header angeben
Weblinks
- Google Qualitätsrichtlinien
- Copyscape
- Virante
- Article Checker
- Plagium
- Similar Page Checker
- Siteliner
Quellen
- http://support.google.com/webmasters/answer/66359?hl=de
- http://www.seo-summary.de/doppelte-inhalte-duplicate-content-verhindern
- http://plus.google.com/+MattCutts/about
- http://www.youtube.com/watch?v=mQZY7EmjbMA
- http://karrierebibel.de/funf-tools-mit-denen-sie-duplicate-content-auf-die-schliche-kommen/
- http://support.google.com/webmasters/answer/139066?hl=de