Le blog d'Inéolab
Inéolab met à votre disposition son expertise sur des thématiques diverses.

Qu’est-ce que le contenu dupliqué / Duplicate Content ?

contenu dupliqué / Duplicate Content
Contenu dupliqué / Duplicate Content

Le Duplicate Content, contenu dupliqué en français, désigne des contenus qui sont trop similaires et accessibles à des URLs différentes. En interne, cette problématique peut survenir entre plusieurs pages d’un même site. En externe, le même phénomène peut se produire lorsqu’un site copie vos contenus ou vice versa. Le contenu dupliqué est un véritable fléau pour le référencement naturel (SEO).

 

Quels sont les symptômes pour votre site ?

Pas de pénalité à proprement parlé donc pas d’actions punitives mais plutôt des effets néfastes plus ou moins importants.

D’abord, si votre site est sujet au contenu dupliqué, il peut souffrir d’une dilution de sa popularité. En effet, le bénéfice de vos backlinks se trouvera redistribué vers des URLs différentes. Par conséquent, vos efforts de référencement seront amoindris par le contenu dupliqué.

Ensuite, vous diminuez vos chances de voir vos contenus indexés rapidement et fréquemment. En d’autres termes, vous êtes victime du gaspillage de votre « budget crawl » puisqu’il y a plusieurs pages au contenu similaire à crawler. Les robots Google vont perdre leur temps à crawler des contenus non pertinents.

Pour couronner le tout, le Duplicate Content est aussi et surtout une perte de temps colossales et inévitable pour pouvoir le corriger.

Une épidémie qui touche particulièrement les sites e-commerce

Pourquoi les sites e-commerce ?

La problématique de Duplicate Content est davantage présente sur un site e-commerce à cause de la complexité de la structure de celui-ci et du nombre de pages dû aux références produits et aux déclinaisons.

  • Le filtrage des sites e-commerce génèrent de nouvelles URLs pour la couleur, la taille, etc. Plus vous avez de filtres et plus vous êtes exposés à un grand nombre de contenus dupliqués.
  • La version imprimable propose une autre URL de la page avec sensiblement le même contenu que la page d’origine.
  • Les sessions ID, qui sont attribués à chaque nouveau visiteur et présents dans l’URL, sont également à l’origine de contenus dupliqués.
  • Un produit peut se retrouver dans plusieurs catégories du site entrainant immanquablement du contenu dupliqué car le contenu sera identique mais les URLs seront différentes.
  • Les descriptions de produits présentent dans les pages. Attention aux descriptions de produits communes à plusieurs e-commerçants possédant le même fournisseur !
  • La pagination est aussi un problème récurrent. La pagination entraine très souvent des méta identiques et des URLs différentes pour accéder à un même contenu. Exemple : /page et /page ?p=1.

En bref, soyez prudent et traitez un à un les problèmes de duplicate content que peut rencontrer votre site. Maintenant que vous êtes conscient des multiples sources et causes de contenu dupliqué, il faut trouver et régler les problèmes.

Posologie contre le contenu dupliqué

Détecter le duplicate content

Pour détecter le duplicate content du point de vue des méta, vous pouvez utiliser les outils Screaming Frog qui vous indique facilement les méta dupliquées. Pour ce qui est du contenu interne dupliqué, vous pouvez utiliser l’outil Siteliner.

En revanche pour détecter le contenu dupliqué externe, vous pouvez utiliser des outils comme Copyscape ou KillDuplicate pour trouver des sites qui auraient plagiés vos contenus.

Remède

Il faut s’armer de patience pour s’assurer que chaque page à un contenu unique ainsi que des balises title et méta description unique. Prenez le temps de rédiger des descriptions propres à chacune de vos fiches produits. Cette étape peut s’avérer extrêmement chronophage mais est absolument nécessaire pour éradiquer le duplicate content présent sur votre site.

Les bonnes pratiques à mettre en place :

  • La balise canonical (rel= canonical) est apparue en 2009 et marque une étape importante dans la lutte contre le contenu dupliqué intra et inter-sites. Grâce à cette balise, les moteurs de recherche peuvent déterminer quelle page est « canonique », c’est-à-dire officielle, et quelles pages sont « dupliquées ». Le code suivant est à insérer dans l’entête des pages dupliquées : <link rel=”canonical” href=”URL-de-la-page-canonique” />. Toutes ces pages seront alors considérées comme une seule et même page.
  • Utiliser les redirections 301 lorsque des anciennes URLs sont indexées et que vous souhaitez qu’elles pointent sur les nouvelles URLs.
  • Le domaine préférentiel : il faut définir un domaine préférentiel (avec ou sans www) pour éviter tout contenu dupliqué.
  • No index, sur les pages de recherche par exemple, pour éviter que les moteurs n’indexent les contenus dupliqués

Bien entendu, le remède n’est pas le même pour tous les sites e-commerce, chaque site étant différent il faudra réfléchir à la meilleure façon de sortir de cette problématique tout en satisfaisant les utilisateurs et les moteurs de recherche.

L’infographie complète

Comment éviter le duplicate content sur les sites e-commerce ?

Laisser une réponse

XHTML: Tags utilisables: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

Retour haut de page