Qu’est-ce que le duplicate content ?

Les moteurs de recherche sont des endroits remplis d’informations sur beaucoup de sujets variés, mais quelques fois le même contenu apparaît deux fois sur différentes pages, cela s’appelle le duplicate content ou contenu dupliqué en français. 

Qu’est ce que le duplicate content ? 

C’est quoi le contenu dupliqué ?

Le duplicate content, ou contenu dupliqué en français, est une notion utilisée dans le SEO c’est-à-dire l’optimisation des moteurs de recherche. Cela désigne le fait de retrouver des contenus similaires voire identiques sur internet mais ces contenus ont des liens totalement différents. Pour résumer le contenu dupliqué est le fait de faire un copier coller d’un paragraphe, d’un site internet ou d’une page internet pour le placer autre part.

Le contenu dupliqué est assez souvent une erreur humaine mais quelques fois certaines personnes peuvent le faire intentionnellement ce qui ne permet pas à Google d’organiser correctement les résultats. Cela pose en plus des problèmes juridiques  ainsi que des problèmes pour le référencement naturel.

 

Types de contenu dupliqué 

Il existe deux types de contenu dupliqué appelés contenu dupliqué malicieux et contenu dupliqué non malicieux. En voici les détails : 

  • Contenu dupliqué malicieux : il s’agit du type de duplicate content le plus problématique puisque les faits et gestes sont intentionnels et cela fausse le SEO. Le plus grave est le plagiat d’un contenu déjà présent sur internet et dont le copieur n’est pas propriétaire. Ce contenu dupliqué est sanctionné par les moteurs de recherche qui doivent faire un travail de recherche pour punir le plagieur et légitimer celui qui a été plagié. D’autres formes de contenu dupliqué malicieux sont un peu moins graves que le plagiat, il s’agit d’un accident comme par exemple si deux sites ont presque le même contenu mais écrit différemment sur les deux. Ou encore la possibilité qu’un rédacteur fournisse des textes ressemblant à des sites internet différents car ils évoquent le même sujet. Il peut donc s’agir d’une erreur technique assez fréquente qui se règle assez facilement. 
  • Le contenu dupliqué non malicieux : il ne s’agit clairement pas de la forme la plus grave de duplicate content seulement si elle reste occasionnelle, si cela se répète il se pourrait que cela désavantageux pour le site internet. Il peut s’agir d’une erreur technique ou humaine, qui peut par exemple arriver lors de la réorganisation d’un site internet : certains liens URL peuvent être en concurrence. Cela peut aussi arriver entre les versions mobile et bureau d’un même site internet, il faut donc être prudent et faire appel à des professionnels pour éviter que ce genre de contenu dupliqué n’arrive régulièrement. Généralement il s’agit des boutiques sur internet qui sont le plus touchées par ce genre d’erreurs à cause de fiches produits, certaines descriptions d’objets peuvent être similaires  et cela peut être pris pour du contenu dupliqué.

Comment faire face au contenu dupliqué ?

Pour prévenir les nombreux contenus dupliqués sur un site internet il faut relire assez souvent les pages du site pour éventuellement trouver des erreurs humaines et ainsi les corriger, examiner le rapport d’erreurs de Google appelé Google Search Console et si deux pages similaires restent sur le site internet il faut que Google puisse les différencier. Il faut donc installer une balise pour permettre au robot de Google de bien organiser les résultats. Pour empêcher le contenu dupliqué vers un autre site, il faut souvent examiner les pages internet semblables pour voir s’il n’y a pas de plagiat. Il faut aussi être exigeant quant à l’achat d’un contenu auprès d’un rédacteur SEO.

Le SEO encourt t-il des risques à cause du duplicate content ? 

Le plus grave risque encouru est que le moteur de recherche détecte le plagieur et que celui-ci perde des places dans le référencement. les moteurs de recherche sont de plus en plus performants et sont capables de deviner le site qui a été plagié, et le site qui a plagié peut être défavorisé voire sanctionné et il risque de ne plus apparaître dans les résultats.