URL canonique

Une URL est dite canonique quand elle est considérée comme étant la version originale d’une page et indiquée comme telle sur les moteurs de recherche. L’intérêt est que ces derniers n’indexent pas d’autres pages qui ont repris le contenu de celle d’origine.

Elle est connue sous plusieurs noms : balise canonical, meta canonical, rel=canonical ou encore link rel=”canonical”. En français, on lui donne aussi le nom de balise canonique. Elle est codée en HTML, dans la partie <head>.

Version originale rendue par l’URL canonique

Le problème du contenu dupliqué

C’est un problème récurrent sur Internet : la duplication de contenu. Très généralement, un paragraphe ou même tout un texte, voire une page entière, sont copiés et collés tels quels ou sous couvert de retouches minimes sur d’autres sites web.

Selon la loi, si les sources ne sont pas citées, il s’agit de plagiat.

La fréquence de ce phénomène va croissant avec le type du contenu en question et de sa popularité. Plus il est intéressant et plus il risque de se retrouver publié à nouveau en d’autres endroits.

En revanche, les algorithmes de Google n’aiment pas du tout la duplication de contenu et infligent par conséquent des sanctions à tous les sites internet qu’ils remarquent contrevenants. Ces pénalités opèrent le plus souvent sur le positionnement de ces sites dans les pages de résultats des moteurs de recherche. Ces derniers se retrouvent alors rétrogradés, ce qui impacte immédiatement leur visibilité. À la longue, c’est leur popularité qui est en jeu.

Certaines fois, même, les sanctions bannissent purement et simplement les sites incriminés des résultats des moteurs de recherche.

La balise canonique comme solution Google

Cependant, si les pages dont le contenu est identique – ou même ne serait‑ce que très fortement similaire – sont traquées par les moteurs de recherche, ces derniers risqueraient fort de s’en prendre aussi au contenu original. Le site de la page source serait alors lui également sujet à ces pénalités.

Heureusement, pour remédier à ce problème, Google a mis en place une solution propre et simple, qui permet aux rédacteurs de lui indiquer quelles pages sont canoniques. Ainsi, si une page d’un site se retrouve publiée dans un autre, le rédacteur de cet autre site devra indiquer l’adresse canonique au moteur de recherche de Google.

En faisant ainsi, les moteurs de recherche sauront faire la différence entre pages originales et copiées en termes de contenu. De la même manière, ils n’indexeront pas les pages non originales, ce qui permettra de leur éviter une accumulation inutile de contenus identiques.

Pour ce faire, il faut indiquer « canonical » dans le code HTML des pages au contenu dupliqué :

<link rel="canonical" href="https://www.monsite.fr/url-page.html">

 Ce <link> doit être situé dans le <head>.

On peut également utiliser cette manipulation dans le fichier .htaccess :

Link: <https://www.monsite.fr/url-page.html>; rel="canonical"

L’idée est donc d’indiquer au moteur de recherche d’où le contenu est tiré. Cela peut permettre d’éviter des mésinterprétations de ce dernier pour des cas particuliers, par exemple si un site dispose de deux versions de pages, l’une pour mobiles et l’autre pour PC. À l’aide de l’URL canonique, il suffira seulement d’indiquer pour chacune des pages de l’une des deux versions lesquelles sont canoniques.

 

URL canoniques et erreurs à éviter

Une seule URL canonique mais des contenus différents

En l’occurrence, il s’agit d’une faute commise par inattention. Le problème est que ces pages ne seront pas aussi vues que les autres puisqu’elles sont précisément indiquées comme « non canoniques ».

Une seule page mais plusieurs URL canoniques

Les balises canoniques sont là pour palier la duplication de contenu, puisqu’elles indiquent aux moteurs de recherche que la page web où elles sont présentes tire ses sources d’une autre.

Cependant, la compilation de contenu dupliqué n’est pas gérer par cette balise. Mettre plusieurs URL canoniques est alors inutile, car Google n’en retiendra qu’une et une seule, et pas forcément celle qui serait la plus optimisée.

Mélanger des URL canoniques entre elles ou avec des redirections

A pointe vers B mais B pointe vers A…

URL relatives à la place d’URL absolues

Il vaut mieux que vous indiquiez vos URL canoniques avec « https:// » au début. Le préfixe « http:// », sans s, était préférable il fut un temps, cependant, Google préfère désormais les sites en HTTPS, c’est‑à‑dire un HTTP sécurisé.

 

Conclusion

Afin d’optimiser son site web pour les moteurs de recherche, on peut être amené à indiquer des URL canoniques afin de palier le contenu dupliqué. On s’évite ainsi des pénalités Google, choses qui affecteraient le référencement ainsi que le positionnement du site.

Cependant, en tel cas, le mieux à faire est encore de corriger sa duplication de contenu et d’apprendre à l’éviter à l’avenir.

Vous souhaitez travailler avec NAVIO ? Nous sommes là pour vous !