Duplicate Content finden & vermeiden

Inhaltsverzeichnis
Inhaltsverzeichnis

Die Positionierung Deiner Website im Google-Ranking stellt Dich nicht zufrieden? Eventuell könnte Deine Site Duplicate Content enthalten. In der Folge bewertet die Suchmaschine Deinen Content als irrelevant ein oder straft Dich für die kopierten Inhalte ab. Gleichzeitig leidet die User-Experience. 

 

Was ist Duplicate Content und wie schaden doppelte Inhalte Deinem Ranking konkret? Wie reagiert Google, wenn identische oder ähnliche Inhalte bewusst oder unbewusst veröffentlicht werden? Und wie gelingt es Dir, ausschließlich Unique Content zu erstellen? Wir liefern Antworten! 

 

Doppelte Inhalte schaden Deinem Ranking

Duplicate Content (DC), auch als duplizierter oder doppelter Content bezeichnet, bezieht sich auf Inhalte, die identisch sind oder eine hohe Ähnlichkeit aufweisen. Dabei kann es sich um einzelne Passagen oder ganze Textabschnitte auf einer oder mehreren Websites handeln. 

 

Die großen Suchmaschinen wie Google strafen Duplicate Content ab und honorieren einzigartige, hochwertige Inhalte. Der Grund: Um die Suchintention der Nutzer zu erfüllen, analysiert und kategorisiert die Suchmaschine Millionen von Websites. So wird gewährleistet, dass den Nutzern im Zuge einer Suchanfrage relevante Suchergebnisse zur Verfügung gestellt werden. 

 

Websites mit Duplicate Content dagegen können nicht mehr eindeutig als relevant oder irrelevant eingestuft werden. Dies ist zum Beispiel der Fall, wenn externer Duplicate Content besteht, sodass Google den Content-Ursprung nicht ermitteln kann. Dieser Umstand wiederum kann das Ranking beeinflussen oder sogar dazu führen, dass die Seite nicht indexiert wird. 

 

Doch wann gilt ein Inhalt konkret als Duplicate Content? Nicht jeder doppelte Content wird von Google als Duplicate Content gewertet. So gelten Zitate, die im Quellcode als solche ausgewiesen werden, nicht als duplizierter Inhalt.

 

Darüber hinaus stuft Google diverse Sprachversionen auf Websites nicht als Duplikate ein. Dagegen gelten äußerst ähnliche oder identische Meta-Daten und Passagen auf mehreren URLs oder auf Subdomains als doppelter Content.

 

Ein Tipp: Grundsätzlich gilt ein Inhalt als Duplicate Content, wenn mindestens 70 Prozent der Inhalte mit einer anderen Site oder einem anderen Inhalt übereinstimmen. 

 

Interner Duplicate Content

Inhalte, die doppelt auf einer Website auftauchen, werden als interner Duplicate Content betitelt. Dies trifft zu, wenn Duplikationen im Main Content, im Fließtext oder in der Seitenleiste auftauchen. 

 

Insbesondere Online-Shops bergen ein erhöhtes Risiko, duplizierten Content zu veröffentlichen. Betroffen sind häufig Kategorieseiten, Produktseiten und Seitentypen wie Tag- oder Filterseiten. Aus diesem Grund solltest Du die Kategorie zum Beispiel nicht in der URL der Produktseite aufgreifen. 

 

Auch “Noise” (sich wiederholende Textblöcke), druckerfreundliche Seiten oder eine mobile Version Deiner Website können dazu führen, dass Google Deine Inhalte als duplizierten Content wertet.

 

Dabei kann sich der Duplicate Content im Detail verstecken. Duplicate Content im Footer (Boilerplate Content) beispielsweise ist schwer auszumachen. 

 

Externer Duplicate Content

Doppelte Inhalte, die sich über mindestens zwei Domains erstrecken, werden als externer Duplicate Content bezeichnet. Zum Teil entstehen die duplizierten Inhalte bewusst, indem Website-Eigentümer Inhalte stehlen und per Copy-and-paste veröffentlichen. 

 

Des Weiteren kopieren Scraper-Seiten Deine Inhalte, um sie mit Werbung anzureichern. Als Betreiber einer kleinen Website mit einer geringen Domain-Authority solltest Du Deinen Content aus diesem Grund stets durch Google über “Abruf wie durch Google” indizieren lassen.

 

Externer Content kann jedoch auch bestehen, wenn User Deine Website über mehrere Domains erreichen. Ein hohes Ranking unterbindest Du somit selbst, da Google die Relevanz nicht bewerten kann. 

 

Zudem solltest Du darauf verzichten, Herstellerangaben zu kopieren oder Inhalte über einen RSS-Feed einzuspielen. Bei der Veröffentlichung und Verbreitung von PR-Materialien wie Pressemeldungen ist ebenfalls Vorsicht geboten. 

 

Near Duplicate Content

Near Duplicate Content umfasst sehr ähnliche Inhalte. Möglich ist, dass der Inhalt kopiert und im Nachgang leicht angepasst wurde. Ebenso kann es sich um eine Kopie des Inhalts handeln, wobei sich der Boilerplate Content unterscheidet. 

 

Der Boilerplate Content bezieht sich auf Website-Inhalte, die als Erweiterung des Hauptteils der Website fungieren. Der ergänzende Content wiederholt im Regelfall Inhalte des Hauptteils und tritt häufig im Header, Footer oder in Sidebars der Website auf. 

 

Google läutet Feldzug gegen Duplicate Content ein

Duplicate Content vermeiden: Suchmaschinen sind auf eine schnelle und unkomplizierte Informationsbeschaffung ausgelegt. Wer einen Begriff oder eine Phrase in der Google-Suche eingibt, profitiert von gefilterten Suchergebnissen. 

 

Um relevante Suchergebnisse auszuspielen, kategorisiert Google die Websites und ermittelt die relevantesten Inhalte. In der Folge legen die Suchmaschinen Wert auf Uniqueness (einzigartige, aktuelle Inhalte). Doppelter Content erschwert es den Suchmaschinen, die Relevanz einer Website zu bewerten. 

 

Offiziell weist Google zwar darauf hin, dass Duplicate Content keine Maßnahmen gegen die jeweilige Website zur Folge hätte. Allerdings sind Abstrafungen nicht auszuschließen. Dies ist der Fall, wenn Duplicate Content zu einer bewussten Täuschung der User oder zur Ranking-Manipulation (Scraping) eingesetzt wird. 

 

Bei der Erkennung von Duplicate Content kommt in der Regel der Shingle-Algorithmus zum Einsatz. Jedoch gilt das genaue Vorgehen von Google als Betriebsgeheimnis.

 

Der Shingle-Algorithmus unterteilt Inhalte in Schindeln (Shingles). Diese werden anschließend zum Beispiel in einem Paket aus 3 Wörtern (Level-3-Shingles) verglichen. 

 

Die Schnittmenge ergibt die Vereinigungsmenge in Prozent. Ähneln sich zum Beispiel zwei von vier Wörter, beträgt die Vereinigungsmenge 50 Prozent. 

 

In dem Moment, in dem Du Google die Interpretation Deiner Beweggründe für den doppelten Content überlässt, besteht ein Risiko. Denn um ähnlichen Content in den Suchergebnissen zu vermeiden, entfernt die Suchmaschine die als doppelter Content bewertete Site aus den SERPs.

 

Wird Deine Site als Duplicate Content bewertet, obwohl Du als Urheber zu betrachten bist, erreichen User Deine Webseite nicht mehr. In der Folge kann Dein Umsatz stagnieren.  

 

Webmastern ist demnach dazu zu raten, Duplicate Content von vornherein zu vermeiden und die Website stetig auf doppelte Inhalte zu überprüfen.

 

Und so wird Deine Seite bestraft

Duplicate Content wird nicht bestraft, sofern der Google Algorithmus keine mutwillige Täuschung als Beweggrund ermittelt. Auf das Ranking der Suchergebnisse kann sich der doppelte Content dennoch negativ auswirken. Denn Google favorisiert Unique Content. 

Content-Diebstahl verursacht nachhaltige Schäden

Eine Abstrafung durch Google erfolgt, wenn die Suchmaschine Anhaltspunkte für einen mutwilligen Diebstahl der Inhalte ausmacht. In diesem Fall wird Deine Website auf die Blacklist gesetzt. Diese umfasst Scraper-Sites, die Inhalte automatisiert kopieren. 

 

Aber auch Content Spinning setzt Google mit einer Verletzung des Urheberrechts in Verbindung. Dabei werden Content-Pieces automatisiert angepasst. Doorway Pages wie Local Landing Pages, die allein für die Suchmaschine konzipiert werden, befinden sich ebenfalls häufig auf der Blacklist. 

 

Doch wie wird das Urheberrecht im Internet definiert? Das Urheberrecht bezieht sich auf Originalwerke, die einer natürlichen Person (dem Urheber) entstammen. Der Urheberschutz gilt über den Tod hinaus und erlischt 70 Jahre nach dem Ableben des Urhebers. Werden Werke Dritter verwendet, muss die Veröffentlichung genehmigt werden. 

 

Unser Tipp an Dich: Nutze Tools, um doppelte Inhalte zu finden

Doppelter Content adé: Um ein hohes Ranking zu erzielen, ist es unerlässlich, Deinen Content in regelmäßigen Abständen auf Duplicate Content zu überprüfen. Verbindest Du die technische SEO mit der Erstellung von Unique Content, setzt Du den Grundstein für eine Website mit Inhalten, die der Google-Algorithmus als relevant bewertet. 

 

Hier nutzt Du die Google-Suche und gibst Deinen Text in Anführungsstrichen in der Suche ein. Wird Dir der Text auf einer externen Website angezeigt, handelt es sich um Duplicate Content. 

 

Zur umfassenden Kontrolle Deines Contents verwendest Du ein professionelles Tool wie Google Search Console. Auf diese Weise ermittelst Du den Prozentsatz Deines Unique Contents. Google Search Console bietet Dir die Chance, doppelte Inhalte im Index zu eliminieren. 

 

All in One: Seobility OnPage Tool

Das Ranking in wenigen Schritten optimieren: Das Seobility OnPage Tool ist eine Software für die OnPage-Analyse von Websites. Damit gelingt es Dir spielend leicht, die gesamte Website mittels Crawling auf inhaltliche sowie technische Probleme zu überprüfen. 

 

Im Anschluss erstellt Dir das Tool ein Reporting, das die Technik, Struktur und den Inhalt der Site umfasst. Einen Überblick über Deine Projekte liefert Dir das Dashboard. Das Modul “Inhalt” versorgt Dich mit Tipps und Tricks zur Content-Optimierung, insbesondere zur OnPage-Optimierung. 

 

Inbegriffen sind Seiten ohne Fließtext, doppelte Inhalte und die Keyword-Kannibalisierung. Dabei umfasst die Inhaltsanalyse doppelte Textblöcke, Keywords und Rechtschreibfehler.

 

OffPage-Inhalte mit Google Alerts vergleichen

Um duplizierte Inhalte auf externen Websites ausfindig zu machen, verwendest Du Google Alerts. Das Tool bietet Dir die Möglichkeit, spezifische Textabschnitte unter dem Ausschluss Deiner eigenen Seite einzugeben. 

 

Google Alerts überprüft im Anschluss externe Seiten und benachrichtigt Dich, wenn ein Duplicate Content ausfindig gemacht wird. Das bedeutet: Sobald ein Externer Deine Inhalte kopiert und veröffentlicht, sendet Dir das Tool einen Alarm. 

 

Wir sagen Duplicate Content den Kampf an!

Hast auch Du Dir die Frage gestellt, wie Du Duplicate Content zukünftig vermeidest? Kennst Du die konkreten Ursachen für doppelte Inhalte, kannst Du handeln. Wir liefern drei Tipps und Tricks, wie Du Dich effektiv vor Double Content schützt! 

Miste aus: Organisiere klare URL-Strukturen

Eine URL pro Inhalt: Die strukturelle OnPage-Optimierung umfasst die Zusammenführung ähnlicher Inhalte auf eine URL und die Anlegung von einer URL pro Unique Content.

 

Beachte außerdem, dass ausschließlich Link-Varianten auftreten sollten, die notwendig erscheinen. Länderspezifische Inhalte markierst Du darüber hinaus mit hreflang Tags. So erkennt Google, dass es sich um Inhalte in verschiedenen Sprachen handelt.  

 

Ohne technische SEO-Optimierung wirst Du den Kampf verlieren

Zur Kennzeichnung von Duplicate Content verwendest Du folgende Tags: 

 

  • Meta Robots Tags: Die Elemente im Quellcode enthalten Informationen und Befehle für den Crawler. Ein typisches Header-Format ist Folgendes: [meta name]=“robots“ oder content=“noindex,follow“

 

  • Canonical Tags: Die Canonical Tags unterstützen Google dabei, Original-Inhalte und Duplicate Content zu differenzieren. Ohne Tag kann ein Indexierungsfehler auftreten, indem Google Deine Website zu häufig crawlt. 

 

  • hreflang: Um Übersetzungen zu kennzeichnen, verwendest Du den hreflang Tag. Der Tag sollte bereits bei der Entwicklung einer Website berücksichtigt werden. 

 

Schaffe einzigartige Inhalte, die Google belohnt

Um die Suchintention Deiner User zu erfüllen, verzichtest Du fortan auf Duplicate Content und entwirfst einzigartige Inhalte mit einer hohen Informationsdichte. Etabliere Dich zukünftig als Experte auf einem Gebiet und gewinne das Vertrauen der Nutzer, indem Du Content publizierst, der sich von Deinen Mitbewerbern unterscheidet. 

 

Ein Top-Ranking lässt sich zudem nicht mit einem überarbeiteten, gestohlenen Text erzielen. Selbst die Erstellung eines einzigartigen Contents, der zu 10 Prozent um doppelte Inhalte ergänzt wird, gefährdet Deinen Ranking-Erfolg auf Google. Versetze Dich stattdessen in Deine User hinein und überrasche sie mit Lösungen, die konkret auf ihre Ausgangslage zugeschnitten sind. 

 

Ähnliche Artikel

Mit Trustfactory erfolgreich auf Google werden.

Erprobte Maßnahmen, datengetriebene Strategien und ROI-starke Prozesse. Trustfactory ist Deine skalierbare Komplettlösung für nachhaltigen Erfolg auf Google. Mehr Besucher, bessere Reputation und ein positiver News Flow – jetzt SEO-Analyse-Gespräch anfordern:

Finde heraus, welches Potenzial in Deinem SEO steckt.

Trustfacotry Zugang Vector Grafik

Kostenloses Gespräch mit einem SEO-Experten erhalten!