La balise rel= »canonical », souvent appelée URL canonique, est une solution pour lutter contre les problèmes de contenu dupliqué lorsque plusieurs variantes de la même page existent.
En substance, la canonique vous permet de spécifier quelle version de la page doit être considéré comme la canonique : la page que vous souhaitez voir apparaître dans les moteurs de recherche.
Gardez à l’esprit les meilleures pratiques suivantes lorsque vous mettez en œuvre des balises canoniques :
- Utilisez des URL absolues (incluant le https et le www.), y compris le domaine et le protocole.
- Définissez une seule URL canonique par page.
- Définissez l’URL canonique dans la section <head> de la page ou dans l’en-tête HTTP.
- Pointer vers une page indexable.
Sommaire
Qu’est-ce qu’une URL canonique ?
L’élément de lien rel= »canonical », souvent appelé URL canonique, est un élément HTML qui permet d’éviter le contenu dupliqué en indiquant aux moteurs de recherche de préférer un document à d’autres documents identiques ou similaires.
💡 Lorsque la page A possède un élément de lien canonique référençant la page B, on dit que la page A a été canonisée.
La canonisation est le processus par lequel une version préférée d’une page est sélectionnée parmi plusieurs autres versions.
Synonymes pour URL canonique
Bien que leur signification ne soit pas la même, les termes suivants sont souvent utilisés pour désigner l’URL canonique : balise canonique, lien canonique, rel canonical ou rel= »canonical ». Par souci de facilité, lorsque nous ferons référence à l’élément HTML canonique, nous l’appellerons URL canonique.
Pourquoi avez-vous besoin d’une URL canonique ?
L’URL canonique vous permet d’éviter le contenu dupliqué, tant en interne qu’en externe. Le contenu dupliqué interne se produit à l’intérieur de votre site Web. Le contenu dupliqué externe se produit lorsque des pages dupliquées ou très similaires existent sur différents domaines.
Les URL canoniques évitent les problèmes de contenu dupliqué
👉 L’URL canonique indique à Google, Bing et Yahoo quelles pages afficher et quelles pages masquer dans les pages de résultats des moteurs de recherche. Bien que les moteurs de recherche puissent choisir d’ignorer l’URL canonique, elle vous permet, en tant que propriétaire de site Web, de mieux contrôler la présence en ligne de votre site.
À quoi ressemble une URL canonique ?
Vos visiteurs ne verront pas l’URL canonique lorsqu’ils visiteront votre site web. Une URL canonique peut être définie dans le code source de la page ou dans l’en-tête HTTP.
Code source de la page
L’URL canonique doit être située dans la section <head> du code source de la page. Pour notre page d’accueil, l’URL canonique se présente comme suit :
<head> <link rel= »canonical » href= »https://www.agence90.fr/ » /> </head>
En-tête HTTP
La définition de l’URL canonique dans l’en-tête HTTP est souvent utilisée lorsque vous devez définir une URL canonique sur un document non-HTML, tel qu’un PDF.
Dans l’en-tête HTTP, cela se présente comme suit :
HTTP/1.1 200 OK
Server: nginx
Date: Mon, 22 Nov 2021 11:51:43 GMT
Content-Type: application/pdf
Content-Length: 21462
Last-Modified: Tue, 23 Nov 2021 10:32:08 GMT
Link: <http://www.exemple.fr/downloads/whitepaper.pdf> ; rel= »canonical »
Les scénarios possibles dans lesquels vous auriez besoin d’utiliser l’en-tête HTTP pour définir l’URL canonique d’un document non-HTML sont ceux où le contenu est proposé à la fois sous forme de page web ordinaire (document HTML) et de PDF (document non-HTML).
Remarque : actuellement, seul Google prend en charge la définition de l’URL canonique à l’aide de l’en-tête HTTP. Pour les images, Google ne prend pas en charge une URL canonique définie par le biais de l’en-tête HTTP.
We don't use rel=canonical for images in Image Search. We do use it for PDFs in web-search though.
— johnmu is not a chatbot yet 🐀 (@JohnMu) August 23, 2016
Quand devez-vous utiliser une URL canonique ?
Il n’existe aucun scénario concevable dans lequel l’inclusion d’une URL canonique est une mauvaise idée. Google, Bing et Yahoo s’appuient fortement sur l’URL canonique pour déterminer les pages à afficher ou à masquer dans les pages de résultats des moteurs de recherche. L’URL canonique peut soit se référencer elle-même, soit référencer une autre page.
URL canonique se référençant elle-même
S’il n’existe qu’une seule version d’une page, assurez-vous que l’URL canonique est auto-référencée.
En gros, cela indique aux moteurs de recherche : « Je suis la seule version de cette page, et je suis la seule à devoir être indexée ».
URL canonique référençant une autre page
S’il existe plusieurs versions d’une page, assurez-vous que l’URL canonique référence la page que vous préférez voir indexée par les moteurs de recherche.
Voici les cas courants dans lesquels les URL canoniques permettent de résoudre les problèmes de contenu dupliqué :
- Lorsque des paramètres de requête avec des points d’interrogation sont utilisés dans l’URL.
- Lorsque les pages sont légèrement différentes, ce que l’on appelle communément des near-duplicates.
- Lorsque plusieurs versions d’une page ont été créées intentionnellement.
Paramètres de requête dans l’URL
Selon la structure de l’URL d’un site web, les URL contiennent parfois des paramètres de requête. Les paramètres de requête dans les URL sont utilisés pour demander un certain contenu.
Prenons un exemple :
www.exemple.fr/chaussures/nike?lang=fr&id=93
- La variable lang=fr indique que la langue de la page demandée est le français (FR).
- La variable id=93 indique que la page numéro 93 doit être demandée.
- Entre les variables se trouve un caractère & qui indique que vous voulez la version française (FR) de la page 93.
Si les paramètres d’interrogation sont pratiques, les URL qui en contiennent sont difficiles à lire et il est facile de créer du contenu en double.
L’URL www.exemple.fr/chaussures/nike?id=93&lang=fr demande exactement la même page que www.exemple.fr/chaussures/nike?lang=fr&id=93, mais les pages ont une URL différente. Cette forme de contenu dupliqué peut facilement être corrigée par une URL canonique.
Pages légèrement différentes (near-duplicates)
Lorsque les pages ne sont que légèrement différentes, nous les appelons souvent « near-duplicates ». Un bon exemple de pages quasi dupliquées est celui des sites e-commerces qui vendent des chaussures. Imaginez que vous ayez une chaussure Nike Air Max taille 38 disponible en rouge, bleu et noir. Si vous choisissez une autre couleur, l’URL change, mais 99 % du contenu de la page reste le même.
- La page de listing Nike Air Max taille 38 : www.exemple.fr/chaussures/nike/homme-38/
- La page de listing Nike Air Max taille 38 en rouge : www.exemple.fr/chaussures/nike/homme-38-rouge/
- La page de listing Nike Air Max taille 38 en bleu : www.exemple.fr/chaussures/nike/homme-38-bleu/
- La page de listing Nike Air Max taille 38 en noir : www.exemple.fr/chaussures/nike/homme-38-noir/
👉 Le contenu de ces quatre pages étant très similaire, il est logique d’avoir une URL canonique de www.exemple.fr/chaussures/nike/homme-38-rouge/, www.exemple.fr/chaussures/nike/homme-38-bleu/ et www.exemple.fr/chaussures/nike/homme-38-noir/ pointant vers www.exemple.fr/chaussures/nike/homme-38/.
Création intentionnelle de plusieurs versions d’une page
Il peut y avoir de nombreuses raisons de créer intentionnellement plusieurs versions d’une page. En voici deux exemples :
- Les pages de destination personnalisées pour les campagnes Google Ads.
- Réalisation de tests d’optimisation du taux de conversion où vous testez trois versions de la même page, qui ont essentiellement le même contenu.
Lorsqu’il existe plusieurs versions d’une page, veillez à faire pointer l’URL canonique vers la version préférée que vous souhaitez voir indexée. Lorsqu’une URL canonique fait référence à une autre URL, cela indique aux moteurs de recherche qu’il existe plusieurs versions de votre page qui sont soit identiques, soit très similaires. Pour que l’index de Google soit propre, assurez-vous que son moteur indexe la page à laquelle vous faites référence à travers la balise canonique. Cette balise canonique doit se trouver sur toutes les pages concernées.
Des versions desktop et mobile distinctes sur votre site
Si vous avez des pages en version desktop et des pages mobiles distinctes (en utilisant un site mobile), vous devez utiliser l’URL canonique et l’URL alternative pour communiquer la relation entre ces pages aux moteurs de recherche.
Pour l’instant, Google est le seul moteur de recherche qui prend en charge cette mise en œuvre spécifique.
Utilisez l’attribut mobile pour communiquer une version mobile d’une page.
Version desktop
Sur la version de bureau de la page, l’URL canonique et l’URL alternative dans la section <head> se présentent comme suit :
<head>
<link rel= »canonical » href= »https://www.exemple.fr/ » />
<link rel= »alternate » href= »https://m.exemple.fr/ » />
</head>
Version mobile
Sur la version mobile de la page, l’URL canonique dans la section <head> se présente comme suit :
<head>
<link rel= »canonical » href= »https://www.exemple.fr/ » />
</head>
De cette façon, les moteurs de recherche affichent la version mobile de la page pour les appareils mobiles, et la version de bureau de la page pour les ordinateurs.
URL canonique inter-sites
L’URL canonique peut être utilisée pour éviter le contenu dupliqué dans les cas où les problèmes de contenu dupliqué vont au-delà d’un seul site web. Lorsque le contenu est publié sur plusieurs pages, sur plusieurs domaines, l’URL canonique inter-domaines peut être utilisée pour signaler aux moteurs de recherche quelle version de la page doit être indexée.
Consolider les pages inutiles avec des redirections
Lorsque l’existence de plusieurs versions d’une page n’est pas nécessaire, il est préférable de rediriger les pages redondantes vers la version préférée. Exemples dans lesquels une redirection est un bien meilleur moyen de gérer les versions multiples des pages :
- Une page est accessible via les protocoles HTTP et HTTPS.
- Une page est accessible via plusieurs domaines (www.exemple1.fr, www.exemple2.fr, www.exemple3.fr) ou sous-domaines (info.exemple.fr, info2.exemple.fr, info3.exemple.fr).
💡 Veuillez noter que, si vous utilisez des redirections dans les exemples ci-dessus, il est recommandé d’utiliser également l’URL canonique. Si vos redirections cessent de fonctionner, vous avez toujours votre URL canonique en place pour éviter les problèmes d’indexation.
Quelles sont les bonnes pratiques à appliquer ?
L’URL canonique est un outil très puissant dans la boîte à outils d’un webmaster. Il est essentiel de respecter les meilleures pratiques ci-dessous lorsque vous travaillez avec des URL canoniques afin d’éviter les problèmes d’indexation :
- Utilisez des URL absolues : il ne doit y avoir aucun doute sur la page qu’un moteur de recherche doit indexer. Utilisez l’URL complète, y compris le protocole (HTTP ou HTTPS), le sous-domaine et le domaine.
- Une URL canonique par page : il ne devrait toujours y avoir qu’une seule URL canonique par page.
- Placement dans la section <head> ou l’en-tête HTTP : l’URL canonique doit toujours être placée dans la section <head> ou dans l’en-tête HTTP.
- Pointer vers une page indexable : l’URL canonique doit pointer vers une page indexable.
- N’incluez que la version canonique d’une page dans le sitemap XML.
Utilisez des URL absolues
Nous ne devons utiliser que des URL absolues comme URL canoniques. Prenons un exemple :
<link rel= »canonical » href= »https://www.exemple.fr/services/reparation-auto/ »>
Avec cette balise comme URL canonique, il n’y a aucun doute sur l’emplacement exact de l’URL.
Comparez maintenant l’URL canonique ci-dessus à l’URL ambiguë ci-dessous :
<link rel= »canonical » href= »reparation-auto/ »>
Certains serveurs web sont par défaut mal configurés, rendant chaque page de votre site web accessible par tous les domaines et sous-domaines. Cela entraîne une quantité énorme de contenu dupliqué, que vous devez éviter à tout prix.
Le fait d’avoir des URL absolues en tant qu’URL canoniques permet d’éviter ce genre de problèmes de contenu dupliqué.
Une URL canonique par page
Il ne devrait toujours y avoir qu’une seule URL canonique par page. Si plus d’une URL canonique est définie, les moteurs de recherche risquent de s’y perdre. Google a déclaré qu’il choisira simplement l’une des URL canoniques et ignorera les autres lorsqu’il rencontrera plusieurs URL canoniques sur une page. Bien que nous ne sachions pas exactement comment Bing et Yahoo traitent les URL canoniques multiples par page, ils recommandent de n’utiliser qu’une seule URL canonique par page.
Good points :). FWIW in general if the canonical situation isn't clear, we'd just pick one or the other, we wouldn't drop both.
— johnmu is not a chatbot yet 🐀 (@JohnMu) August 22, 2017
Placement dans la section <head>
L’URL canonique doit toujours être placée dans la section <head> de votre page. Si l’URL canonique n’est pas placée dans la section <head>, les moteurs de recherche ne seront pas en mesure de la trouver et de la traiter. En retour, cela peut conduire à des problèmes de contenu dupliqué.
Référencez une page indexable
L’URL canonique doit toujours faire référence à une page indexable. Les moteurs de recherche peuvent s’embrouiller lorsque l’URL canonique fait référence à une page qui est redirigée 301 ou qui est elle-même canonisée.
N’incluez que la version préférée dans le sitemap XML
Toutes les pages incluses dans votre sitemap XML doivent être indexables par les moteurs de recherche. Il est donc important, dans le cas où vous avez plusieurs versions d’une page, de n’inclure que la version préférée (vers laquelle pointe la balise canonique) de la page dans votre sitemap XML.
Quelles sont les limites de l’URL canonique ?
Si les URL canoniques sont un outil formidable pour les webmasters, elles ont aussi leurs limites.
Elle ne consolide que partiellement le PageRank
Prenons un exemple : la page A possède des backlinks très puissants. La page A fait référence à la page B en tant que canonical. Les moteurs de recherche vont très probablement indexer la page B et laisser la page A en dehors de leur index.
Chaque lien transmet une certaine autorité, appelée PageRank. L’autorité du lien qui est transmise à la page A par le biais de backlinks puissants n’est que partiellement transmise à la page B. Nous disons partiellement car il s’agit d’une zone grise sur laquelle les moteurs de recherche ne sont pas très clairs. Aucune étude ne montre qu’une URL canonique transmet toute l’autorité des liens. En outre, l’URL canonique a été introduite pour communiquer aux moteurs de recherche les pages à afficher et celles à cacher. Par conséquent, notre position sur ce sujet est la suivante : une URL canonique ne transmet pas entièrement l’autorité des liens.
✅ Si vous voulez transmettre le plus de PageRank possible, nous vous conseillons d’utiliser une redirection 301.
Les URL canoniques ne règlent pas les problèmes d’optimisation du crawl
Les URL canoniques sont destinées à résoudre les problèmes de contenu dupliqué. Une URL canonique indique aux moteurs de recherche les pages à indexer, mais ne leur indique pas les pages à explorer. C’est une distinction importante à faire.
Lorsque les moteurs de recherche ne passent pas leur temps à explorer les pages utiles et importantes, on dit qu’il y a des problèmes d’optimisation de l’exploration. Il existe de nombreuses raisons pour lesquelles les moteurs de recherche n’explorent pas les pages utiles et importantes. Les moteurs peuvent se retrouver pris dans des boucles de redirection infinies, passer beaucoup de temps à explorer des pages que vous ne souhaitez pas indexer ou se heurter à des impasses dans votre site web (pages orphelines sans liens vers d’autres pages). C’est du gaspillage, d’autant plus que les moteurs de recherche ont un budget de crawl (le temps alloué à l’exploration d’un site web) pour chaque site. Le fichier robots.txt peut être utilisé pour éviter les problèmes d’optimisation du crawl.
Les questions les plus posées
🔗 Les balises canoniques transmettent-elles le PageRank ?
Nous pensons qu’une certaine autorité de lien est transmise lors de la canonisation des URL mais nous ne pouvons pas l’affirmer avec certitude. La réponse est donc floue quant à savoir si une URL canonique transmet ou non le PageRank d’une page vers une autre. Ce que nous savons, c’est qu’une URL canonique n’est pas destinée à transmettre la popularité d’une page, contrairement aux redirections 301.
⚙️ Puis-je forcer les moteurs de recherche à utiliser mon URL canonique ?
Non, l’URL canonique est un conseil plutôt qu’une directive pour les moteurs de recherche.
➡️ Une URL canonique est-elle meilleure qu’une redirection 301 ?
Une URL canonique et une redirection 301 sont deux moyens entièrement différents pour arriver à une fin. Une URL canonique est utilisée lorsque toutes les versions de la page doivent être accessibles aux visiteurs mais qu’une seule d’entre elles doit être indexée par les moteurs de recherche.
Une redirection 301 fait passer à la fois les visiteurs et les moteurs de recherche d’une URL à une autre. Une URL redirigée n’est pas accessible aux visiteurs ni aux moteurs de recherche.
⚠️ Puis-je impacter négativement mon site web avec des canoniques ?
Lorsqu’elles sont mal utilisées, les balises canoniques peuvent causer des problèmes majeurs pour l’indexation de votre site.
Par exemple, imaginez que pour une raison quelconque, toutes vos pages ont une canonical vers la page d’accueil. Comme l’URL canonique est un signal fort pour les moteurs de recherche, il est fort probable qu’ils le traitent et désindexent les pages canonisées et ne prennent en comptent que le page d’accueil.
Même s’il faut être prudent avec les balises canoniques, nous vous conseillons vivement de les utiliser afin de communiquer aux moteurs de recherche les pages à indexer et celles à cacher.
🤔 Tous les moteurs de recherche supportent-ils l’URL canonique ?
Nous savons que Google, Bing et Yahoo supportent les canoniques.
Yandex et Baidu semblent également prendre en charge la balise canonique.
🙌 Comment les moteurs de recherche traitent-ils plusieurs balises canoniques sur une page ?
Google a déclaré qu’il ignorera complètement les éléments canoniques s’il y a plusieurs URL canoniques sur une page.
On ne sait pas exactement comment les autres moteurs de recherche traitent cette question, mais nous conseillons vivement de n’utiliser qu’une seule URL canonique par page.
🛑 Une URL canonique empêche-t-elle les pages d’être explorées ?
Non, ce n’est pas le cas. Les moteurs de recherche continueront à explorer vos pages, que vous ayez ou non défini une URL canonique pointant vers une autre URL. Une canonique est simplement un signal fort pour les moteurs de recherche concernant la page préférée qui devrait apparaître dans les SERP.
📄 Dois-je utiliser des URL canoniques pour les pages paginées ?
En général, il est recommandé de ne pas utiliser l’URL canonique pour les pages paginées car les pages paginées ne présentent souvent pas le même contenu. Il est plutôt recommandé d’utiliser les attributs rel= »next » et rel= »prev ». C’est une meilleure façon d’expliquer aux moteurs de recherche que les pages paginées sont en fait une série de pages qui suivent une séquence logique.
Vous pouvez utiliser une URL canonique pour une page paginée, mais uniquement si vous avez une page avec un bouton « Afficher tout » qui se charge rapidement. Dans ce cas, vous faites référence à la page « Tout afficher » sur toutes les pages paginées comme URL canonique.
Merci jai fait un peu le ménage grâce à vous…