Skip to main content

Qu’est-ce qu’une balise canonique ?

Une balise canonique (ou rel=canonical) est un petit morceau de code HTML qui aide les moteurs de recherche à déterminer la version « principale » de la page à partir du reste des pages qui sont identiques ou très similaires à celle-ci.

Dans le cadre du référencement, les balises canoniques sont utilisées pour indiquer à Google la version de la page que vous souhaitez voir apparaître dans les résultats de recherche, pour consolider le capital de liens des pages dupliquées et pour améliorer l’exploration et l’indexation de votre site Web.

Voici à quoi peut ressembler une balise canonique sur une page Web :

<link rel="canonical" href="https://www.sixpixels.fr/blog/XXXXX/" />

Pourquoi les balises canoniques sont-elles importantes pour le référencement ?

L’objectif principal de la balise canonique est d’indiquer aux moteurs de recherche quelle est la page principale, la version originale, et quelles sont les pages dupliquées qui se ressemblent.

En général, les sites Web contiennent au moins quelques pages qui sont considérées comme des doublons – elles affichent le même contenu mais avec des URL différentes.

Dans ce cas, Google doit décider quelle page choisir pour l’indexation et le classement. il n’utilisera pas toutes les pages comme résultats de recherche puisqu’elles sont toutes identiques ou très similaires.

Par exemple, les pages de produits ne sont généralement pas affichées uniquement par une URL principale. Elles peuvent également être affichées avec divers paramètres URL souvent utilisés (par exemple pour le tri, la monnaie, les tailles, etc.) :

https://www.boutique.com/vetements/t-shirts.html
https://www.boutique.com/vetements/t-shirts.html?Size=XL
https://www.boutique.com/vetements/t-shirts.html?Size=XL&color=red

Dans cet exemple, la page du produit peut être affichée dans la catégorie principale /vetements/, mais aussi être filtrée et affichée avec des paramètres de taille et de couleur. Elle peut donc être affichée comme résultat de recherche sous 3 URL différentes.

C’est là que les balises canoniques deviennent importantes – elles indiquent à Google que vous souhaitez indexer l’URL principale de la catégorie /vetements/, l’utiliser comme résultat de recherche et ignorer le reste des URL.

Note : Gardez à l’esprit que Google perçoit la balise canonique comme un signal et non comme une directive.

S’il existe des raisons valables de choisir une autre page pour l’indexation et le classement plutôt que la page canonique, le moteur de recherche peut ignorer complètement la balise canonique :

Ou comme Martin Splitt l’a déclaré :

« Très bien, partons de l’idée qu’il s’agit d’une directive, car ce n’en est pas une. »

En plus de l’objectif fondamental de la balise canonique, il y a aussi quelques avantages SEO importants qui en découlent.

1. Elles consolident le PageRank

Les balises canoniques aident à consolider l’équité des liens (PageRank) de toutes les pages dupliquées en une seule page principale et canonique.

Les pages dupliquées peuvent souvent obtenir des backlinks de diverses sources externes – qu’il s’agisse de backlinks de sites Web aléatoires, d’utilisateurs de médias sociaux, etc.

Ces pages reprennent donc partiellement l’équité des liens de la version principale de la page. celle que vous voulez vraiment classer comme résultat de recherche.

En mettant en place des balises canoniques sur les pages dupliquées, le PageRank peut être transféré dans une seule URL et donc améliorer son classement global dans la recherche Google.

2. Elles aident à gérer le contenu syndiqué

Les balises canoniques peuvent indiquer au moteur de recherche quel site web contient la version originale du contenu. et quels sites Web ne font que le republier (ou le syndiquer).

De nombreux propriétaires de sites Web utilisent d’autres sites pour publier leur contenu (à des fins promotionnelles ou autres).

Dans ce cas, Google doit décider quel site Web est la source originale de ce contenu et doit être affiché comme résultat de recherche et quels sites Web ne font que le promouvoir.

La mise en place de balises canoniques sur ces sites Web externes permet de résoudre ce problème et d’obtenir des résultats de recherche. promouvoir la version originale et principale de la page dans la recherche Google.

Ou comme Danny Sullivan l’a dit :

3. Elles améliorent le crawl

Les balises canoniques aident les moteurs de recherche comme Google à explorer efficacement les pages que vous souhaitez réellement explorer et indexer par opposition aux doublons qui ne devraient pas être explorés du tout.

Les pages en double font perdre du temps et des ressources à Google, car elles ne sont pas importantes pour l’exploration ou l’indexation.

En désignant des pages canoniques, Google se concentrera davantage sur les pages les plus importantes et économisera ainsi le « budget d’exploration ».

Ou comme Google l’a officiellement déclaré :

« La page canonique sera explorée le plus régulièrement ; les doublons sont explorés moins fréquemment afin de réduire la charge d’exploration de Google sur votre site. »

Comment ajouter une balise canonique ?

L’ajout de balises canoniques à vos pages est assez simple  : il suffit d’aller sur n’importe quelle page Web dupliquée et d’ajouter la balise rel= »canonical » dans la section <head> de la page.

Le lien dans la balise canonique doit pointer vers la version principale et originale.

La mise en œuvre des balises canoniques doit se faire page par page. Toutefois, cela peut prendre beaucoup de temps et de ressources, voire s’avérer impossible sur les sites Web de grande taille.

Heureusement, les balises canoniques peuvent également être mises en œuvre automatiquement à l’aide de divers plugins tels que Yoast SEO (pour WordPress).

L’implémentation des balises canoniques via ce plugin est assez simple :

  1. Choisir la page pour la canonisation
  2. Allez dans la section « Advanced » de la page.
  3. Ajoutez l’URL canonique à laquelle vous souhaitez faire référence.

Il existe également d’autres moyens d’indiquer à Google vos pages canoniques.

Utiliser l’en-tête HTTP

Les balises canoniques peuvent également être ajoutées dans l’en-tête HTTP de la page Web.

Ceci est particulièrement utile pour les documents spéciaux non-HTML tels que les PDFs. – puisqu’ils ne contiennent pas de section <head> où vous pourriez ajouter une balise canonique standard.

Pour implémenter les balises canoniques dans l’en-tête HTTP, vous devez accéder au fichier .htaccess de votre site et ajouter la balise canonique sous une forme qui peut ressembler à ceci :

Link: <https://www.votresite.com/document.pdf>; rel="canonical"

Conseil : Il existe également quelques autres moyens d’indiquer au moteur de recherche les pages que vous souhaitez voir devenir des versions canoniques :

  • Plan du site – Google peut automatiquement supposer que toutes les URL énumérées dans le plan Sitemap sont les versions principales et canoniques.
  • Redirection – Les pages dupliquées peuvent transférer le trafic ainsi que tous les signaux de la page dans l’URL unique et canonique via les redirections 301.
  • Liens internes – Google peut déterminer plus facilement quelles pages sont canoniques si des liens internes de votre site pointent vers elles depuis des pages dupliquées.
  • HTTPS – Les moteurs de recherche comme Google préfèrent généralement les pages en tant que canonicals qui ont un certificat SSL valide (par opposition aux pages sans cryptage – HTTP).

Meilleures pratiques pour les balises canoniques

1. Utiliser des balises canoniques auto-référencées

Bien que cela ne soit pas obligatoire, c’est toujours une bonne pratique d’ajouter une balise canonique sur une page qui pointe vers elle-même. Même si vous n’avez pas utilisé de balises canoniques sur le reste des pages dupliquées.

L’utilisation de balises rel=canonical auto-référencées sur les pages principales et originales indique clairement aux moteurs de recherche comme Google qu’il s’agit de versions canoniques :

« Je recommande de faire ce genre de rel=canonical autoréférentiel parce que cela nous indique vraiment clairement quelle page vous voulez voir indexée ou ce que cette URL devrait être lorsqu’elle est indexée. » (John Mueller).

2. Utiliser des URL absolues

Les URL absolues dans les balises canoniques peuvent vous aider à éviter les erreurs involontaires ou une mauvaise interprétation des URLs canoniques par un moteur de recherche (par opposition aux URL relatives).

Les URL absolues doivent également inclure https, //, www, et des barres obliques de fin (si possible).

Voici un exemple d’URL absolue dans une balise canonique :

<link rel="canonical" href="https://www.monsite.com/mapage/" />

3. Utilisez des URL en minuscules

Les moteurs de recherche comme Google peuvent être sensibles aux majuscules et minuscules dans les URL.

Il est également préférable de ne pas utiliser de caractères spéciaux ou accentués dans les URLS.

L’utilisation de minuscules dans les URL canoniques peut donc vous aider à maintenir la cohérence et à éviter les problèmes de duplication aux yeux des moteurs de recherche.

Comme bonne pratique, essayez d’utiliser les minuscules dans les URL sur vos serveurs ainsi que de les appliquer aux balises canoniques.

4. Canonicaliser les doublons inter-domaines

Les balises canoniques peuvent également référencer vos pages principales à partir d’autres domaines. et pas seulement de votre site web.

Si vous avez du contenu dupliqué présent sur des pages d’un autre site web (par exemple, un article répliqué sur un site d’information), vous devez faire :

  • utiliser la balise canonique auto-référencée sur votre page originale
  • appliquer la balise canonique sur la page externe en faisant référence à votre page originale

Que faut-il éviter avec les balises canoniques ?

1. Plusieurs balises canoniques sur une page

Faites attention aux multiples balises canoniques qui peuvent apparaître par accident dans le HTML d’une page.

Bien que rare, le fait d’avoir plus d’une balise canonique sur une page peut créer une confusion pour le moteur de recherche et entraîner l’ignorance de ce signal canonique..

Ou comme Google l’a officiellement déclaré :

« En cas de déclarations multiples de rel=canonical, Google ignorera probablement toutes les indications de rel=canonical. Tout avantage qu’une rel=canonical légitime aurait pu offrir sera perdu. »

2. Éviter les canoniques sur les non-duplicates

Assurez-vous toujours que le contenu des pages dupliquées et de la version principale de la page est identique ou du moins presque similaire. lorsque vous appliquez des balises canoniques.

La mise en place de balises canoniques sur des pages complètement différentes risque de perturber les moteurs de recherche ou d’être complètement ignorée :

Ou comme Martin Splitt l’a expliqué :

« … si le contenu est complètement différent ou suffisamment différent pour que les algorithmes décident qu’il ne s’agit pas d’une duplication, alors la canonique est inutile. »

3. Les canoniques sur les pages paginées

Les pages paginées contiennent du contenu fragmenté sur plusieurs pages différentes (par exemple, la section des commentaires du site Web divisée en pages « 1 », « 2 », « 3 »).

Dans ce cas, vous devez toujours utiliser des balises canoniques auto-référencées sur chaque page individuelle. – et ne pas faire référence à la page « 1 » à partir du reste des pages paginées :

« La principale chose à éviter, puisque ce billet traite de la canonisation, est d’utiliser le rel=canonical de la page 2 pointant vers la page 1. La page 2 n’est pas équivalente à la page 1, donc le rel=canonical comme cela serait incorrect. » (John Mueller)

4. Ne pas bloquer les canoniques via robots.txt

Vous ne devez jamais bloquer les URL avec des balises canoniques par le fichier robots.txt.

Le fichier robots.txt empêchera Google d’explorer les pages dupliquées – il ne pourra donc pas voir la balise canonique référençant la version principale de la page.

En outre, bloquer les URL qui contiennent des balises canoniques empêchera également le transfert du PageRank dans vos versions principales.

5. Ne pas utiliser canonical dans le <body>

Les balises canoniques doivent toujours être appliquées dans la section <head> de vos pages et non à d’autres endroits du document HTML.

Google ignorera tout simplement vos balises canoniques dans la section <body> ou à tout autre endroit.

6. Évitez les boucles et les chaînes canoniques

Vous devez toujours essayer d’utiliser des balises canoniques renvoyant directement à la page principale afin d’éviter les boucles canoniques (similaires aux boucles de redirection).

Par exemple, l’utilisation d’une balise canonique de la page A à la page B, puis de la page B à la page C, créera une chaîne canonique susceptible d’embrouiller les moteurs de recherche et de leur faire perdre du temps et des ressources.

Si vous éprouvez des difficultés à mettre en place les balises canoniques, n’hésitez pas à faire appel à notre agence SEO à Toulon