Néanmoins, je vous incite à aller lire ce qui est dit sur son site Web1.
On y apprend que le principal élément du logiciel est le « PageRank,
un système de classement des pages Web mis au point par les fondateurs
de Google (Larry Page et Sergey Brin) à l’université de
Stanford ». Le PageRank (qui signifie en anglais classement des pages,
mais est aussi un jeu de mots sur le patronyme de l’un des deux fondateurs
de Google) est donc l’algorithme qui permet de hiérarchiser les
informations moissonnées par Google. Sur la même page du site Web
de Google, le PageRank est défini de la manière suivante :
« PageRank est un champion de la démocratie : il profite des
innombrables liens du Web pour évaluer le contenu des pages Web et
leur pertinence vis-à-vis des requêtes exprimées. Le principe de Page-
Rank est simple : tout lien pointant de la page A à la page B est considéré
comme un vote de la page A en faveur de la page B. Toutefois,
Google ne limite pas son évaluation au nombre de « votes » (liens)
reçus par la page ; il procède également à une analyse de la page qui
contient le lien. Les liens présents dans des pages jugées importantes
par Google ont plus de « poids », et contribuent ainsi à « élire »
d’autres pages ».
Dans Google Story2, David Vise explique que le modèle qui a prévalu
à l’élaboration du PageRank est celui des revues scientifiques :
« Page avait une théorie. Compter le nombre de liens pointant vers
un site Web était un moyen de mesurer la popularité de ce site. Alors
que la popularité et la qualité ne vont pas forcément de pair, Brin et
Page, tous les deux, avaient grandi dans un milieu où l’on attache de
l’importance à la recherche qui est publiée dans des revues scientifiques
avec des citations. Les liens, dans un certain sens, rappelaient à
Page les citations. Les scientifiques ont l’habitude de citer les articles
sur lesquels ils basent leurs travaux et ces citations sont un moyen pratique
de mesurer l’influence d’un chercheur dans la communauté
scientifique et universitaire ».
David Vise fait ici référence à la notion de facteur d’impact3 (impact
factor) qui est un indice statistique qui mesure le nombre de citations
dans les périodiques scientifiques. Cette analogie à la communauté
scientifique est censée constituer un brevet d’honorabilité, mais de
nombreux chercheurs s’élèvent contre la tyrannie du facteur d’impact
qui est un critère beaucoup plus quantitatif que qualitatif. Nous ne
1. http://www.google.fr/intl/fr/why_use.html
2. Google story, Dunod, 2006
3. http://urfist.univ-lyon1.fr/FacteurImpact.pdf