Contenu dupliqué interne : quel impact sur le référencement ?

Défini comme un contenu similaire publié sur différentes pages, le contenu dupliqué (duplicate content, dans le texte) reste au centre des problématiques de référencement éditorial. Partielle ou totale, interne ou externe, la duplication du contenu est un élément à considérer sous peine de voir l’indexation du site dans les moteurs sérieusement dégradée. Dans cette première partie, nous nous concentrerons essentiellement sur les contenus dupliqués propres à un même site. Définition, risques et solutions : tour d’horizon des pratiques relatives au duplicate content.

Contenu dupliqué : définition

Largement traitée par nos amis référenceurs, la notion de contenu dupliqué se définit comme la présence d’un contenu similaire sur une ou plusieurs pages :

-  d’un même domaine : on parle de duplication interne

-  d’un domaine différent : il s’agit alors de duplication externe

De même, les contenus peuvent être dupliqués :

-  en totalité, soit l’ensemble du site

-  de manière partielle, soit seulement quelques éléments clés

Un taux de similarité avoisinant 10% semble être la limite tolérée par Google.

Publication de contenu dupliqué : quels risques ?

Ultra motivé pour proposer aux internautes les contenus les plus pertinents qui soient, Google désapprouve clairement la publication de contenus dupliqués, jugés peu qualitatifs. Cette pratique vous expose à de sérieux désagréments en matière de référencement. Selon la proportion de contenu dupliqué détectée :

-  Une baisse de positionnement, voire un déclassement total de la page concernée

-  Une désindexation partielle ou totale du site

-  Une dilution du juice du site, et donc des possibilités d’indexation amoindries

Les contenus concernés par la duplication interne totale

Outre le fait de proposer un même article sur plusieurs pages (la forme la plus basique du duplicate content), d’autres pistes sont à explorer afin d’identifier les contenus perceptibles par Google comme dupliqués.

Les cas suivants sont susceptibles d’entrainer une duplication totale du contenu de votre site, ce qui, à terme, pourrait pénaliser son positionnement :

-  Une même page est accessible via plusieurs url.
Ex : vous avez publiez un même article sur plusieurs pages. C’est mal et vous le savez ! Autre cas plus tendancieux, vous proposez un produit accessible depuis plusieurs catégories, ce qui entraine une diffusion multiple d’une même fiche produit sur des pages aux url différentes.

-  Le site est accessible via une url classique type http:// et via une url sécurisée sous la forme https://. Dans ce cas, vous indiquez aux moteurs deux chemins d’accès à un même contenu… Conséquence, chaque chemin perd en valeur aux yeux du moteur, puisque le juice de chaque page est dilué.

- Le site est accessible via une url type www.monsite.com et via monsite.com. Même constat que pour le point précédent.

- L’index du site répond à plusieurs url de type monsite.com/index/ ; monsite.com/index.php ou encore monsite/index.htm. Idem…

- Un contenu similaire est publié dans une même langue, sur un site multilingue, organisé en sous domaine ou en répertoires. En clair, un même article en français est publié sur votre site en version française, suisse et belge. Une seule page sera alors indexée.

- Une même page est accessible en session à l’aide d’une ID ou sans.

- Le site propose une version du contenu en « dur » sur le site et une même version imprimable en pdf. Cette variable est alors intégrée à l’url de la page, ce qui nous ramène au cas n°1 !

Duplicate content : le cas des contenus dupliqués partiellement

Si pour écarter tous risques de contenu dupliqué, 90% du contenu doit être unique, il est recommandé de se pencher également sur les contenus dupliqués partiellement. Là encore plusieurs cas sont envisageables. Vos contenus peuvent être jugés comme dupliqués si :

- les balises Title et Description similaires sont nombreuses

- la page de résultat de votre moteur interne reprend trop d’éléments

- les articles sont proposés avec une pagination ET en version complète

- la catégorisation automatique des pages / articles génère des url différentes pour une même page. C’est notamment le cas pour certaines versions wordpress

- le contenu publié est spinné… (Ce qui, en soi, vous garantit de publier un contenu m**dique, commentaire personnel J)

 

Détecter les contenus dupliqués internes au site 

Une fois, toutes ces pistes passées en revue, il est temps de faire un point complet sur votre site afin d’identifier les contenus dupliqués. Pour cela, deux outils phares proposés par google : le moteur de recherche et Webmaster Tool.

Commencez par repérer les balises dupliquées sur plusieurs pages. Rien de plus simple, les pages concernées sont listées par Webmasters tool, rubrique Optimisation, puis Améliorations HTLM.

Autre alternative, utilisez la requête site:nomdusite.com depuis Google. Ainsi, vous visualiserez l’ensemble des pages indexées  pour un repérage manuel des balises dupliquées.

Afin d’identifier les pages https indexées, utilisez la requête site:nomdusite.com- inurl:https. La méthode est valable également pour vérifier les sous domaine, en remplaçant inurl:https par  inurl:monsous-domaine

Quelles solutions pour supprimer un contenu dupliqué au sein de votre propre site ?

L’état des lieux de vos contenus dupliqués dressé, il est temps d’aborder les solutions à mettre en œuvre pour éviter la désindexation de vos pages. Vous pouvez procéder en deux temps : d’abord, la mise en conformité des contenus, puis les paramétrages propres au site.

Les actions propres aux contenus dupliqués :

- Si deux pages proposent un contenu similaire, n’en conservez qu’une. Pour cela, mettez en place une redirection 301 depuis le .htaccess du site. Ainsi, lorsque Google va crawler le site, il sera redirigé vers ma bonne page.

- Retravaillez vos articles de manière à proposer un contenu unique. Pour cela, ajoutez des informations, jouez avec les synonymes, reformulez… ou faites appel à des rédacteurs professionnels !

- Réécrivez les balises Title et Descriptions de manière à ce qu’elles soient toutes uniques. Vous y gagnerez sur la longue traine au passage !

-  Redirigez les liens internes vers les bonnes pages

Les solutions à déployer sur le site

- Proposez des url cohérentes,  simplifiées et uniques. Sur WordPress, de nombreux plugins peuvent vous y aider.

- En cas de site multilingue, optez pour un domaine en .fr pour la version française et .de, pour la version allemande, par exemple, plutôt qu’un domaine en .com, accessible par pays via des sous domaines.

- Indiquez à google l’url à privilégier pour l’indexation en ajoutant une balise no index sur la mauvaise page

- Demander à Google la suppression des pages inutiles, toujours à l’aide de Webmaster Tool (rubrique Optimisation, puis URL à supprimer).

- Mettez à jour votre Sitemap

- En cas de désindexation de votre page, voire du site, procédez à demande de réexamen auprès de google http://support.google.com/webmasters/bin/answer.py?hl=fr&answer=35843

 

Guideline Google au sujet du contenu dupliqué : http://support.google.com/webmasters/bin/answer.py?hl=fr&answer=66359

Une réponse à to “Contenu dupliqué interne : quel impact sur le référencement ?”

Laisser un commentaire