On entend sans cesse parler du PageRank. Mais de quoi parle-t-on exactement ? Cet indicateur est-il pertinent, est-il d’actualité ? On fait un petit point sur l’histoire du PageRank, son importance dans le SEO et son fonctionnement technique.
Mais si vous voulez estimer la puissance SEO d’une page ou d’un domaine, spoiler : le PageRank ne vous sera d’aucune utilité.
Sommaire
Le PageRank ou comment déterminer algorithmiquement la popularité d’un site
Si le lien a une telle importance dans la pratique du SEO, cela s’explique par son rôle primordial dans le calcul algorithmique de la popularité d’une page, paradigme sur lequel se basent les moteurs de recherche pour établir le ranking des sites web dans leurs index respectifs. L’algorithme en question, appelé PageRank suivant le nom de son inventeur, Larry Page, ingénieur et co-fondateur de Google, permet de mesurer quantitativement la popularité d’une page web.
L’invention du PageRank
Lors de son invention en 1998 par Larry Page et Sergey Brin (voir le brevet), qui étaient alors deux étudiants de Stanford, le monde des moteurs de recherche est fortement concurrencé par de nombreux moteurs aux performances aléatoires voire même hasardeuses. Les résultats étaient massivement faux et facilement trucables : les moteurs se basaient largement sur la densité d’un mot-clé sur une page pour déterminer son ranking sur des requêtes comprenant ce mot-clé. C’est-à-dire qu’il suffisait de répéter les mêmes mots plusieurs fois, avec de la mise en gras, ou dans des balises de titre, ou même dans la balise <meta keyword="mot_clé">
spécialement prévue à cet effet.
C’est dans ce contexte qu’intervient l’invention du PageRank :
« L’algorithme qui a fait la fortune de Google et constitue son joyau le plus précieux » – Dans l’esprit du PageRank, Dominique Cardon.
L’histoire et le fonctionnement du PageRank
Le PageRank est un indice qui permet de déterminer la popularité d’une page sur le web sur une échelle exponentielle. Sa force a été de se baser sur les liens hypertextes, et plus spécifiquement les liens entrants d’un site (backlinks) pour déterminer la popularité et l’autorité d’un site web.
« [Le PageRank] tire parti de la structure relationnelle des pages, qui se tiennent entre elles par des liens hypertextes, pour en extraire un ordre qui capitalise le sens des interactions qu’ont entre eux les internautes qui publient sur le web » – Dans l’esprit du PageRank, Dominique Cardon.
Cette idée n’est pas révolutionnaire, elle est profondément inspirée de la tradition de la sociométrie qui analyse les groupes sociaux via le prisme des relations qu’entretiennent ses membres. En outre, elle s’inscrit dans la suite des travaux d’Eugène Garfield et du Science Citation Index, qui était une base de données de citations d’essais et d’articles scientifiques officiellement lancée en 1964. Bien que cette base de données n’ait pas été pensée pour évaluer l’autorité ou la popularité d’un chercheur, c’est bien une des fonctions principales des systèmes d’archives de publications scientifiques contemporains qu’elle a inspirés : le nombre de fois où une publication est citée communément reconnu comme un indice d’autorité et de popularité dans le milieu de la recherche académique.
Soulignons deux emprunts importants que le PageRank fait au SCI et qui sont essentiels à l’algorithme :
- Il interprète le lien comme un vote quelle que soit la nature dudit lien.
On peut tout à fait faire un lien à un site web que l’on critique amèrement, pourtant le PageRank interprétera ce lien comme un signal de confiance.
- Il comprend la présupposition qu’un lien est honnête et émis volontairement.
C’est à dire établi par un atome différent du réseau étudié (un site web autonome, appartenant à un propriétaire différent du site vers lequel le lien est réalisé et dont les intérêts ne sont pas communs). De toute évidence, ce n’est pas toujours le cas, et c’est ce prisme fondateur qui engendra tous les problèmes de spamdexing et de blackhat SEO qui ont été mitigés progressivement à travers le temps grâce à des filtres (Pinguin) et des mises à jours de l’algorithme de Google (« Core Updates »)
Le calcul du PageRank
Il y a différentes formules mathématiques du PageRank qui permettent de calculer un PageRank que je ne détaillerai pas ici, notamment parce que je n’ai pas les compétences requises pour les décortiquer et les expliquer, mais si cela vous intéresse, vous pouvez vous référer à la méthode originale de Google.
Ce qu’il faut retenir, c’est que le PageRank est un algorithme itératif qui prend en considération les éléments suivants lors du calcul du score d’une page :
- La quantité et le score des pages pointant vers la page considérée (backlinks)
- La quantité de liens sortants sur les pages des backlinks
Retenons donc ces deux points :
- Plus le PageRank d’une page est élevée, plus le signal de popularité qu’elle envoie à travers ses liens est élevé
- Plus une page fait de liens, plus le signal de popularité qu’elle envoie à travers ses liens est faible : c’est la condition de possibilité du PageRank Sculpting, question épineuse par ailleurs.
La Google ToolBar PageRank (TBPR)
Dans les années 2000, Google proposait une extension de navigateur qui fournissait une approximation du PageRank des sites visités sur le navigateur : cette extension s’appelait la Toolbar PageRank. Les sites disposaient d’une notation allant de 0 à 10 sur une échelle logarithmique représentant leur degré de popularité. En France, le PageRank le plus élevé constaté via cet outil avant sa discontinuation s’élevait aux alentours de 8/10.
En pratique, cette estimation du PageRank permettait aux SEO de comparer la popularité de leurs sites et surtout de fixer un prix pour la vente de liens (pratique strictement prohibée par Google) : plus le PageRank était élevé, plus le lien était considéré comme puissant, et donc son prix augmenté. Google ayant évolué au fil des années, et utilisant d’autres algorithmes pour suppléer le PageRank, l’indice de l’outil perdait progressivement sa signification. La façon dont il était couramment interprété (un étalon généralisé de la puissance SEO d’un site web) étant eronnée, et poussant les webmasters à tenter d’obtenir le score le plus élevé possible, souvent par des pratiques illégitimes, la firme de Mountain View a décidé de mettre un terme à l’outil en Avril 2016.
Le PageRank est-il toujours utilisé par Google ?
Oui, le PageRank est sans doute encore utilisé comme signal de ranking par Google. Mais dans une forme probablement complètement différente de celle du brevet original (à ce propos, voir le paradigme du surfeur raisonnable, introduit par Google en 2010) et en conjonction avec plus de 200 autres facteurs de ranking.
Donc à la question de savoir s’il faut chercher à calculer/optimiser son PageRank, la réponse sera systématiquement non. D’ailleurs, aucun des indicateurs couramment utilisés aujourd’hui pour estimer la puissance d’une page ou d’un domaine ne se réclament du PageRank, ce qui serait par ailleurs absurde. La plupart de ces indicateurs tentent de répliquer un ensemble de facteurs de ranking utilisés par les moteurs de recherche, avec notamment un accent prononcé sur la thématique des sites webs (topical)
Notons tout de même un scénario d’usage courant du PageRank : il permet de visualiser efficacement des problèmes de maillage interne. Un site dont les pages de conversion ont un PageRank faible, et les pages à faible valeur ajoutée un PageRank élevé, est sans équivoque un site mal conçu qui demande à être réorganisé.
Ce qu’il faut retenir de cet article
- Le PageRank est un algorithme itératif qui permet d’estimer la popularité d’un site web à partir de ses backlinks.
- Le PageRank compte historiquement parmi les facteurs clé de réussite de Google dans le marché concurrentiel des moteurs de recherche.
- Non, le PageRank n’est pas mort. Mais il ne doit pas être considéré comme un indicateur pertinent ou un objectif à atteindre.
0 commentaires