Accueil » Blog » La balise canonique contre le dupliqué

La balise canonique contre le dupliqué

Indiquer à Google la page à prendre en compte prioritairement parmi toutes les pages de contenu similaire est possible grâce à l’attribut rel=canonical.

Contenu dupliqué (Duplicate content)

Qu’entend-on par duplication de contenu (Duplicate content) ? C’est la diffusion de contenus très proches sur le Web, par exemple, des pages de produits répertoriant la même gamme de produits, une fois par ordre alphabétique, l’autre fois par prix ou alors des communiqués de presse publiés sur différents sites. Le contenu dupliqué est un frein au référencement.

Google évite le contenu dupliqué pour deux raisons :

  • Fournir les résultats les plus pertinents à ses utilisateurs en évitant la duplication des résultats ;
  • Eviter d’alourdir ses bases de données.

Quand il rencontre 2 pages similaires, Google retient celle qui lui paraît la plus adaptée à la requête de l’internaute. L’autre page qu’il identifie comme contenu dupliqué atterrit dans un index secondaire.

Le problème se pose par exemple si vous publiez un communiqué de presse et que ce dernier est publié par un site tiers ayant optimisé ce contenu de manière plus efficace que le vôtre. Vous risquez de vous retrouver dans un index secondaire et le site qui diffuse votre communiqué, dans les premiers résultats des moteurs.

Google propose l’attribut rel=canonical qui permet au webmestre de définir lui-même la version préférée parmi les différentes pages et d’indiquer à Google la version à prendre en priorité dans les résultats de recherche.
On parle de page canonique. Il suffit pour le webmestre d’intégrer cet attribut rel=canonical.

L’insertion de l’attribut rel=canonical dans les pages de son site n’est pas en soi difficile, mais lorsqu’il s’agit de celui de tiers, la tâche peut s’avérer plus ardue.
C’est le cas notamment de sites diffusant un communiqué, une dépêche, les contenus repris par des sites partenaires dans le cadre d’un contrat (publicité pour des produits, services), etc.
Que faire ? Plusieurs solutions s’offrent à vous :

  • Demander aux sites partenaires de faire un lien vers la page canonique définie comme telle ;
  • Demander aux sites qui reprennent ce contenu d’insérer une balise à l’intérieur de leur page indiquant aux moteurs qu’ils ne doivent pas les suivre (un noindex ou un fichier Robots.txt).

Dans le cadre d’une campagne de communiqués de presse, que faire ?

  • Proposer son communiqué sur un seul site ;
  • Ou ne proposer qu’une partie (snippet, accroche et description) en faisant un lien vers la version longue du communiqué sur le site “émetteur” du communiqué de presse.

Pour aller plus loin : googlewebmastercentral.blogspot.com

Un outil pour détecter le contenu dupliqué : DuplicateContent

Contenu dupliqué

Ce que dit l’équipe de Qualité de Recherche de Google en février 2010
Nathalie Peret, de l’équipe Qualité de Recherche de Google a précisé quelques points relatifs au contenu dupliqué lors du SEO Campus 2010.

Le duplicate content n’est pas sanctionné comme tel par Google, mais il a un effet négatif sur le SEO :

  • Il dilue la popularité des liens (link juice) ;
  • Googlebot passe du temps à crawler le contenu dupliqué et donc, il en passe moins sur le nouveau contenu ;
  • Il multiplie les URL de contenus identiques dans les pages de résultats.

Voici une liste non exhaustive d’éléments sources de contenu dupliqué :

  • Noms de domaine : www.site.com, site.com/index.php, site.com,etc. ;
  • Version imprimée des pages ;
  • Fiche produit ;
  • Contenu affilié ;
  • Communiqué de presse, etc.

Comment éviter le contenu dupliqué ?

  • Recourir à la redirection 301 (et pas 302 qui est une redirection temporaire).
  • Utiliser la rel=canonical sur la page ou le nom de domaine à privilégier par les moteurs de recherche (pour info, Google Webmaster Tools permet de définir le nom de domaine canonique).
    Pour vérifier si vous avez une duplication de noms de domaine, lancez la requête site:monsite.com. Vous verrez ainsi quelle version de nom de domaine est retenue et s’il n’existe pas plusieurs versions sur la page de résultats des moteurs de recherche. Attention : les liens internes doivent également reprendre le même nom de domaine privilégié.
  • Recourir aux cookies pour ne pas générer une nouvelle page à chaque fois que le visiteur vient sur le site.
  • Rendre le contenu unique. Par exemple, dans le cas des fiches de biens immobiliers contenant chacune la description de la ville et du département où se situe le bien, il faut proposer du texte différent pour chaque fiche sous peine de voir celle-ci considérée comme contenu dupliqué.

Faites appel à nos services en matière de référencement et de rédaction web !

Commentaires des lecteurs

Aucun commentaire en ce moment.

Votre commentaire

Your email address will not be published.

Je suis un humain*

This site uses Akismet to reduce spam. Learn how your comment data is processed.