est que le projet de recherche qui devait déboucher sur un doctorat de
l’université de Stanford s’est transformé en une société cotée en
bourse, ce qui change quand même la perspective. Nous verrons plus
loin que la pression des actionnaires permet d’ailleurs de passer outre
certains principes canoniques qui n’auraient pourtant jamais dû être
transgressés.
Le PageRank qui se prétend le champion de la démocratie est bel et
bien une boîte noire1 et l’idéal démocratique ne saurait souffrir ce manque
de transparence. Mais il n’est peut-être pas très pertinent de
s’appesantir sur le PageRank car Google reconnaît qu’il n’est pas l’unique
critère de tri des résultats de recherche et que des webmestres
malintentionnés peuvent tenter de le manipuler. Ainsi, dans un documentaire
diffusé sur Arte en mai 20072, Franck Poisson (ex Directeur
général de Google France) nous dit qu’« il faut savoir que derrière
l’algorithme de Google, ce sont plusieurs dizaines de millions d’équations
mathématiques qui vous donnent ce sentiment d’avoir des résultats
très pertinents ». Ce chiffre paraît étonnamment élevé et il
participe sûrement à la volonté de l’entreprise d’occulter la réalité sous
une avalanche de paramètres techniques et d’épater la galerie. En parcourant
le site Web de Google on est également un peu étonné
d’apprendre que l’on peut améliorer le classement de son site3 et qu’il
existe toute une série de techniques que Google condamne pour gonfler
artificiellement le classement PageRank de son site4. Pour résumer
la situation, non seulement le PageRank juge la popularité à coup
d’équations mathématiques dont on ne connaît pas le détail, mais des
petits malins peuvent tricher et biaiser les calculs en contournant le
système. Si c’est cela la démocratie, alors je m’en passe bien volontiers.
Dans ces conditions, on ne peut que regretter que la communauté
scientifique ne se fasse pas plus entendre sur le sujet et ne montre pas
une plus grande alacrité à expertiser la technologie du moteur de
recherche. Les chercheurs en informatique s’intéressent finalement
assez peu à Google et, par exemple, une recherche sur le terme Page-
Rank dans la base de données ScienceDirect (qui contient plus de
8 millions d’articles de périodiques scientifiques) renvoie moins d’une
trentaine de références. On ne sait pas très bien comment interpréter
1. En informatique, à la différence de l’aéronautique, une boîte noire est un
modèle logique où les informations entrent et ressortent sans que l’on ait une
idée du traitement qu’elles ont subi à l’intérieur.
2. Faut-il avoir peur de Google, documentaire de Sylvain Bergère et Stéphane
Osmont, Arte, 2007
3. www.google.fr/support/webmasters/bin/answer.py?answer=34432&topic=8524
4. www.google.fr/support/webmasters/bin/answer.py?answer=35769