Duplicate Content

Duplicate Content (engl. für „doppelter Inhalt“), oft auch als „DC“ abgekürzt, ist das Vorhandensein von identischen Inhalten (Content) auf einer oder mehreren Websites. Man unterscheidet zwischen internem Duplicate Content und externem Duplicate Content.
Interner Duplicate Content kann schon alleine dadurch entstehen, dass ein und derselbe Inhalt auf der eigenen Website unter mehreren URLs aufrufbar ist.

Beispiel:
http://beispielseite.de/produkt/content
http://beispielseite.de/produkte/content
Achtung:
Beide URLs zeigen auf denselben Artikel. Das ist doppelter Content.
Externer Duplicate Content kann auftreten, wenn eine Website in mehreren Sprachversionen verfügbar ist, jedoch mit mehr als einer Sprachversion auf dem gleichen Suchmarkt (z. B. google.de) in den Suchergebnissen auftaucht.
Beispiel:
http://beispielseite.de/produkt/content
http://beispielseite.de/en/produkt/content (wenn die Seite auch auf Deutsch ist)
Anscheinend ist auch dies doppelter Content. Es empfiehlt sich, es jedoch zuerst zu testen. Auch Google-Aussagen müssen nicht immer richtig sein.
Interner und externer Duplicate Content
Es wird zwischen internem und externem Duplicate Content unterschieden. Interner Duplicate Content beschränkt sich auf die eigene Domain/einen Hostnamen, wohingegen externer Duplicate Content domainübergreifend, also unter zwei oder mehreren Domains, auftritt.
Beispiel interner Duplicate Content
Häufig haben z. B. Onlineshops mit internem Duplicate Content zu kämpfen. Hier ist es ein oft gesehener Fall, dass die Produkt-Detailseiten auch ohne zugehörige
Kategorie- und/oder Produktseite direkt aufrufbar sind:
http://beispielseite.de/produkt/content
http://beispielseite.de/content
Schadet doppelter Content (Duplicate Content)?
Oft werden diese Inhalte dann von Suchmaschinen indexiert, da z. B. von extern auf beide URLs verlinkt wurde. Inkonsistente bzw. eine nicht einheitliche interne Verlinkung ist ebenfalls ein Grund dafür.
Was Duplicate Content nicht ist
Liegt ein Inhalt in mehreren Sprachversionen vor, z. B. in deutscher und englischer Sprache, so wird dies nicht als Duplicate Content gewertet. Auch Zitate oder zitierte Textpassagen werden nicht als Duplicate Content identifiziert.
Bei der Zitierung von Inhalten sollte auf die korrekte semantische Auszeichnung im Quelltext geachtet werden:
Hier steht der zitierte Text – Hier steht der Name des zitierten
Autors oder der Quelle
Warum stellt Duplicate Content ein Problem dar?
Aus Sicht von Google kommt Duplicate Content einem Betrugsversuch gleich, zudem behindert er Google in dem Bestreben, das bestmögliche Ergebnis für den User zu finden.
Originalantwort von Google: 

Google ist sehr darum bemüht, Seiten mit unterschiedlichen Informationen zu indizieren und anzuzeigen. […] Gelegentlich wird Content jedoch bewusst auf verschiedenen Domains dupliziert mit der Absicht, das Ranking bei Suchmaschinen zu beeinflussen oder mehr Zugriffe auf sich zu ziehen.
Derart unfaire Verhaltensweisen können zu einer negativen Nutzererfahrung führen, da den Besuchern im Grunde derselbe Content in einer Reihe von Suchergebnissen angezeigt wird.

Aus diesen Gründen kann das Vorhandensein von Duplicate Content zu einer Abstrafung durch Google führen und sollte von Webmastern ernst genommen werden.
Duplicate Content führt zwar nicht immer zu einer Abstrafung durch Google, jedoch könnte ein andauerndes Duplicate-Content-Problem der Website nachhaltig schaden, weil es z. B. nach einer Zeit zu einer Abstrafung kommen könnte oder Indexierungsprobleme auftreten.
Des Weiteren könnte Duplicate Content u. a. für Schwankungen in den SERPs (Suchergebnisseiten), also den Rankings, verantwortlich sein, da es für Google nicht klar ersichtlich ist, welche Seite den relevantesten Inhalt für die gestellte Suchanfrage bietet, und so munter die Ziel-URLs wechselt.
Google versucht Duplicate-Content-Probleme selbst zu lösen
Google versucht bei einem bestehenden Duplicate-Content-Problem selbst zu identifizieren, welcher Inhalt am relevantesten für die vom User gestellte Suchanfrage

WordPress SEO-Fit machen ist, und gibt dieses Ergebnis in den SERPs (Search Engine Result Pages) aus. Bei der vorangegangenen Indexierung der Inhalte versucht Google ebenfalls die bestmögliche Version (URL) der doppelten Inhalte zu identifizieren und indexiert nur diese – sofern dies gelingt.
Sind die Rankings und der Traffic einer Website trotz eines bestehenden Duplicate-Content-Problems und eventuell schwankenden indexierten Seitenzahlen konstant, ist das Duplicate-Content-Problem für die Performance der Website erst einmal nicht weiter schlimm.