Google Panda
Le nom de Google Panda vient de l’ingénieur Navneet Panda, qui a participé à la création de cet algorithme filtre.
Il était régulièrement mis à jour – tous les mois – jusqu’à ce qu’il finisse par faire partie intégrante de l’algorithme de Google. Depuis, toute sanction se fait en temps réel.
À quoi sert Google Panda précisément ?
L’algorithme Google Panda a pour but de lutter contre la mauvaise qualité des sites et de leur infliger des sanctions en l’occurrence. Ce genre de sites internet est appelé « fermes de contenu », ou « content farm » ou encore « content mill » en anglais.
Ces sites créent à tout-va des contenus médiocres et souvent sans grands liens entre eux, dans le seul but de produire des vues, et donc de la visibilité, ce qui augmenterait alors l’audience. Il s’agit d’une technique à rapprocher du référencement abusif (spamdexing), qui, comme son nom l’indique, consiste à abuser les moteurs de recherches avec des monceaux d’informations pour se retrouver mieux positionner sur leurs pages de résultats.
De même que la piètre qualité du contenu des sites web, le contenu dupliqué (duplicate content) est lui aussi dans la ligne de mire de Google Panda. Cette duplication peut exister sous différentes formes, que voici :
- Le contenu dupliqué interne : Il s’agit d’une forme d’intertextualité visant à intégrer un extrait ou plus d’un ancien article dans un nouveau ;
- Le contenu dupliqué externe : Il s’apparente au plagiat, car peu souvent le site source est prévenu du copier-coller effectué. On peut s’en prémunir en utilisant une balise canonique, que Google priorisera.
- Le contenu automatique : Il s’agit d’une technique de scraping (ou harvesting), c’est-à-dire d’un contenu produit grâce à un outil de génération de texte pivoté (content spinning), qui consiste à tourner et retourner un texte déjà existant pour lui donner une nouvelle forme qui lui est unique. Cette technique était très utilisée au début des années 2010 jusqu’à ce qu’elle se fasse sanctionner.
- Les commentaires spam : Souvent utilisés sur les blogs, ils sont considérés comme faisant partie des différents types de contenu dupliqué car ils sont repris tels quels automatiquement par des bots, des agents logiciels – des logiciels automatiques programmés pour exécuter des tâches répétitives. Cette duplication d’un même contenu peut être effective sur des milliers et des milliers de sites web, ce qui en outre pollue les espaces commentaires. Heureusement, une technique simple pour se prémunir des spams à ce niveau reste encore l’utilisation d’un captcha.
Quelles pénalités peut infliger Google Panda ?
L’intérêt de Google Panda n’est pas que de traquer les sites web de piètre qualité en filtrant la Toile. En effet, quand il sévit, il déclasse tous les sites dont il juge la qualité médiocre, qui se retrouvent alors repoussés dans les résultats au profit des sites internet ayant de bonne qualité. Parfois, même, Google Panda peut faire blacklister un site web. Dans ce cas, le site coupable disparaît purement et simplement de la Toile. Cela peut même être définitif, le site web ne pouvant alors plus jamais être indexé à nouveau par le moteur de recherche de Google.
Bien entendu, il est rare que Google Panda en arrive à de telles extrémités. En général, il a davantage le sens des proportions et fait seulement retirer une page dont il estime le contenu mauvais, voire une ou deux autres. Cette dernière manière de faire est bien plus graduelle et laisse le temps au site internet impliqué de prendre les mesures adéquates afin de ne pas disparaître.
En 2012, l’algorithme Google Penguin est venu prêter main forte de façon un peu différente à Google Panda.
Vous souhaitez travailler avec NAVIO ? Nous sommes là pour vous !