Que le contenu dupliqué sur un site soit accidentel ou qu’il résulte du vol de texte de vos pages, il doit être abordé et traité correctement. Peu importe que vous gériez le site internet d’une petite entreprise ou d’une grande société ; chaque site est vulnérable à la menace que représente le contenu dupliqué pour les classements SEO.
Dans cet article, nous allons vous expliquer comment trouver du contenu dupliqué et comment gérer correctement les problèmes de contenu copié.
Sommaire
Le contenu dupliqué en bref
Le contenu dupliqué fait référence à un contenu très similaire, ou exactement le même, sur plusieurs pages. Gardez ceci à l’esprit :
- Le contenu dupliqué n’apporte que peu ou pas de valeur ajoutée à vos visiteurs et perturbe les moteurs de recherche.
- Évitez d’avoir du contenu en double, car cela peut nuire à vos performances de référencement.
- Le contenu dupliqué peut être causé par des erreurs techniques ou par du contenu copié manuellement.
- Il existe des moyens efficaces d’éviter que le contenu en double ne devienne un problème dans les deux cas
Qu’est-ce que le contenu dupliqué ?
Au sens strict, le contenu dupliqué désigne un contenu très similaire, voire identique, présent sur plusieurs pages de votre propre site internet ou sur d’autres sites. Au sens large, le contenu dupliqué est un contenu qui apporte peu ou pas de valeur ajoutée à vos visiteurs. Par conséquent, les pages avec peu ou pas de contenu sont également considérées comme du contenu dupliqué.
Pourquoi le contenu dupliqué est-il mauvais pour le référencement ?
Le contenu dupliqué est mauvais pour deux raisons :
- Lorsqu’il existe plusieurs versions du contenu, il est difficile pour les moteurs de recherche de déterminer la version à indexer, et donc à afficher dans leurs résultats de recherche. Cela réduit les performances de toutes les versions du contenu, car elles sont en concurrence les unes avec les autres.
- Les moteurs de recherche auront du mal à consolider les mesures de liens (autorité, pertinence et confiance) pour le contenu, en particulier lorsque d’autres sites internet renvoient à plus d’une version de ce contenu.
Est-il possible de recevoir une pénalité pour contenu dupliqué ?
Le contenu dupliqué peut nuire à vos performances de référencement, mais il ne vous vaudra pas de pénalité de la part de Google tant que vous n’avez pas copié intentionnellement le site internet d’un tiers. Si vous êtes un honnête propriétaire de site internet, que vous rencontrez quelques difficultés techniques et que vous n’essayez pas de tromper Google, vous n’avez pas à craindre de recevoir une pénalité de Google.
Si vous avez copié de grandes quantités de contenu d’autres personnes, vous êtes sur la corde raide. Voici ce que dit Google à ce sujet :
« Le contenu dupliqué sur un site ne constitue pas un motif d’action sur ce site, sauf s’il apparaît que l’intention du contenu dupliqué est d’être trompeur et de manipuler les résultats des moteurs de recherche. Si votre site souffre de problèmes de contenu dupliqué et que vous ne suivez pas les conseils énumérés ci-dessus, nous faisons un bon travail en choisissant une version du contenu à afficher dans nos résultats de recherche. »
Quelle est la solution la plus courante pour corriger le contenu dupliqué ?
Dans de nombreux cas, la meilleure façon de corriger le contenu dupliqué est de mettre en place des redirections 301 des versions non préférées des URL vers les versions préférées. Lorsque les URL doivent rester accessibles aux visiteurs, vous ne pouvez pas utiliser de redirection mais vous pouvez utiliser une URL canonique ou une redirection robots noindex. L’URL canonique vous permet de consolider certains signaux, alors que la directive robots noindex ne le fait pas.
Choisissez soigneusement votre arme pour lutter contre le contenu dupliqué, car elles ont toutes leurs avantages et leurs inconvénients. Il n’y a pas d’approche unique pour lutter contre le contenu dupliqué.
Causes courantes du contenu dupliqué
Le contenu dupliqué est souvent dû à un serveur web ou à un site internet mal configuré. Ces cas sont de nature technique et n’entraîneront probablement jamais de pénalité de la part de Google. Ils peuvent toutefois nuire gravement à votre classement. Il est donc important d’y remédier en priorité. Nous ne rentrerons pas dans les détails dans cet article.
Outre les causes techniques, il existe également des causes humaines : le contenu est volontairement copié et publié ailleurs. Comme nous l’avons dit, ces contenus peuvent entraîner des pénalités s’ils ont une intention malveillante.
Contenu dupliqué causé par un contenu copié
Pages d’atterrissage pour la recherche payante
La recherche payante nécessite des pages d’atterrissage dédiées qui ciblent des mots clés spécifiques. Ces pages sont souvent des copies de pages originales, qui sont ensuite adaptées pour cibler ces mots clés spécifiques. Comme ces pages sont très similaires, elles produisent du contenu dupliqué si elles sont indexées par les moteurs de recherche.
Empêchez les moteurs de recherche d’indexer les pages de renvoi en mettant en œuvre l’attribut meta robots noindex. En général, il est préférable de ne pas créer de liens vers vos pages de renvoi et de ne pas les inclure dans votre sitemap XML.
D’autres sites internet copient votre contenu
Le contenu dupliqué peut également provenir de tiers qui copient votre contenu et le publient ailleurs. C’est notamment un problème si votre site web a une faible autorité de domaine et que celui qui copie votre contenu a une autorité de domaine plus élevée. Les sites web ayant une autorité de domaine plus élevée sont souvent explorés plus fréquemment, ce qui fait que le contenu copié est exploré en premier sur le site web de celui qui l’a copié. Cette personne peut maintenant être perçue comme l’auteur original et se classer au-dessus de vous.
Assurez-vous que les autres sites internet vous reconnaissent en mettant en place une URL canonique menant à votre page et en créant un lien vers votre page. S’ils ne sont pas disposés à le faire, vous pouvez envoyer une demande DMCA à Google et/ou engager une action en justice.
Copier le contenu d’autres sites web
Copier le contenu d’autres sites internet est également une forme de contenu dupliqué. Google a documenté la meilleure façon de gérer cette situation du point de vue du référencement : créer un lien vers la source originale, combiné à une URL canonique ou à une balise meta robots noindex. Gardez à l’esprit que les propriétaires de sites ne sont pas tous satisfaits de la syndication de leur contenu, et qu’il est donc recommandé de leur demander la permission d’utiliser leur contenu.
A lire également : 5 étapes pour optimiser votre contenu SEO lors de la rédaction
Trouver du contenu dupliqué
Trouver du contenu dupliqué sur votre propre site web
Avec des outils, vous pouvez facilement trouver du contenu dupliqué en vérifiant si vos pages ont un titre de page, une méta-description et un titre H1 uniques. Le rapport de couverture d’index de Google Search Console est également très utile pour trouver du contenu dupliqué sur votre site. Soyez à l’affût des listes suivants :
- Dupliqué sans url canonique sélectionné par l’utilisateur : Google a trouvé des URL dupliquées qui ne sont pas canonisées vers une version préférée.
- Dupliqué : Google a choisi une url canonique différente de celui de l’utilisateur. Google a choisi d’ignorer votre canonical sur les URL qu’il a trouvées par lui-même, et attribue à la place les canonicals sélectionnés par Google.
- Dupliqué, l’URL soumise n’a pas été sélectionnée comme canonique : Google a choisi d’ignorer les canoniques que vous avez définis pour les URL que vous avez soumises via un sitemap XML.
Trouver du contenu dupliqué en dehors de votre propre site internet
Si vous avez un petit site internet, vous pouvez essayer de rechercher dans Google des expressions entre guillemets. Sinon, pour les sites web plus importants, vous pouvez utiliser un service tel que Copyscape. Cet outil parcourt le Web à la recherche d’occurrences multiples d’un contenu identique ou presque.