John Mueller de chez Google a apporté une réponse particulièrement intéressante sur la gestion des URL apparaissant comme dupliquées à cause de paramètres.
Le Senior Webmaster Trends Analyst de l’entreprise californienne affirme qu’il ne faut pas mettre ces URL en 404, ce qui est totalement logique. Cependant, il conseille d’utiliser la balise canonique (rel=canonical) car c’est précisément pour cette raison qu’elle existe ! Cela n’aura pas d’impact négatif sur votre SEO.
Voici ci-dessous la retranscription en français des questions des internautes et des réponses de John Mueller à ce sujet sur Reddit :
« Bonjour ! Nouveau dans la communauté mais j’ai été dans le SEO pendant environ 5 ans. J’ai commencé un nouvel emploi en tant qu’unique responsable du référencement et je réfléchis au budget de crawl. Il y a environ 20 000 pages crawlées mais non indexées et 2000 qui sont crawlées et indexés. Cela est du au nombre élevé de paramètres UTM/campagne spécifique dans les URLs et (intentionnellement) de pages en 404.
J’espérais équilibrer un peu ce budget d’exploration en supprimant les paramètres d’URLs UTM/campagne de l’exploration via le robots.txt et en transformant certaines des 404 en 410 (ce qui aiderait également à la santé globale du site).
Quelqu’un peut-il m’aider à déterminer si c’est une bonne idée ou si cela peut causer des dommages ? »
La réponse de John Mueller sur les 404 :
« Les pages qui n’existent pas doivent renvoyer une 404. Vous ne gagnez rien en termes de référencement à les rendre 410. La seule raison que j’ai entendue et que je peux suivre est que cela facilite la reconnaissance des 404 accidentels par rapport aux pages supprimées connues en 410. (Si vos pages importantes deviennent accidentellement des 404, vous le remarquerez probablement rapidement, quel que soit le code de résultat). »
La réponse de John concernant les canoniques :
« Pour les paramètres UTM, je définirais simplement le rel-canonical et les laisserais tranquilles. Le rel-canonical ne les fera pas tous disparaître (ni robots.txt), mais c’est une approche plus propre que le blocage (c’est pour cela que le rel-canonical a été conçu essentiellement). »
« Dans les deux cas, je pense que vous ne verrez pas de changement visible sur votre site dans les résultats de recherche. Le rel-canonical sur les URL UTM est certainement une solution plus propre que de les laisser s’accumuler et sortir d’elles-mêmes. En réglant ce problème au plus tôt, vous n’aurez pas 10 générations de SEO qui vous informeront du problème du contenu dupliqué (qui n’est de toute façon pas un problème s’ils ne sont pas indexés ; et lorsqu’ils sont indexés, ils sont de toute façon abandonnés en tant que doublons). »
En conclusion
Bon, on ne va pas se mentir, que vous utilisiez une canonique ou pas, c’est quasiment la même chose ! John Mueller affirme que d’utiliser une balise canonique ou pas pour des URL dupliquées à cause de paramètres ne changera pas beaucoup de choses étant donné que Google sait très bien les identifier et les traiter en ne les indexant pas.
Finalement, c’est à vous de scruter votre Search Console et de voir si des URL avec paramètres dupliquées sont indexées. Si c’est le cas, mettez des balises canoniques.
De notre côté, on vous conseille de mettre automatiquement des canoniques en place pour les paramètres. Cela évitera toute mauvaise surprise ! Google nous a déjà prouvé par le passé que des erreurs d’exploration et d’indexation pouvaient facilement survenir…
0 commentaires