Le duplicate content (contenu dupliqué) désigne du contenu qui est similaire entre 2 pages web. Ce contenu est pénalisant pour le référencement car les moteurs de recherche privilégie les contenus uniques et original.
Ce terme peut désigner 2 types de contenu identique :
- L’exact duplicate content : qui n’est autre qu’un même contenu disponible sur 2 URL distincte
- Le near duplicate contenu : qui est en réalité un contenu similaire présent sur 2 URL. La différence entre les pages est minime et peut être simplement une différence de contenu dans le footer ou la sidebar
Pour lutter contre le duplicate content il y a plusieurs stratégies envisageables :
- S’assurer que chaque URL possède un contenu unique
- Faire des redirections si 2 pages sont identiques
- Désindexer une page si elle contient du contenu dupliqué
- Eviter de se faire voler du contenu