Dunod - Les dix plaies d'Internet - Dominique Maniez - Entrer en résistance - Opacité du pagerank - page 6
est que le projet de recherche qui devait déboucher sur un doctorat de l’université de Stanford s’est transformé en une société cotée en bourse, ce qui change quand même la perspective. Nous verrons plus loin que la pression des actionnaires permet d’ailleurs de passer outre certains principes canoniques qui n’auraient pourtant jamais dû être transgressés. Le PageRank qui se prétend le champion de la démocratie est bel et bien une boîte noire1 et l’idéal démocratique ne saurait souffrir ce manque de transparence. Mais il n’est peut-être pas très pertinent de s’appesantir sur le PageRank car Google reconnaît qu’il n’est pas l’unique critère de tri des résultats de recherche et que des webmestres malintentionnés peuvent tenter de le manipuler. Ainsi, dans un documentaire diffusé sur Arte en mai 20072, Franck Poisson (ex Directeur général de Google France) nous dit qu’« il faut savoir que derrière l’algorithme de Google, ce sont plusieurs dizaines de millions d’équations mathématiques qui vous donnent ce sentiment d’avoir des résultats très pertinents ». Ce chiffre paraît étonnamment élevé et il participe sûrement à la volonté de l’entreprise d’occulter la réalité sous une avalanche de paramètres techniques et d’épater la galerie. En parcourant le site Web de Google on est également un peu étonné d’apprendre que l’on peut améliorer le classement de son site3 et qu’il existe toute une série de techniques que Google condamne pour gonfler artificiellement le classement PageRank de son site4. Pour résumer la situation, non seulement le PageRank juge la popularité à coup d’équations mathématiques dont on ne connaît pas le détail, mais des petits malins peuvent tricher et biaiser les calculs en contournant le système. Si c’est cela la démocratie, alors je m’en passe bien volontiers. Dans ces conditions, on ne peut que regretter que la communauté scientifique ne se fasse pas plus entendre sur le sujet et ne montre pas une plus grande alacrité à expertiser la technologie du moteur de recherche. Les chercheurs en informatique s’intéressent finalement assez peu à Google et, par exemple, une recherche sur le terme Page- Rank dans la base de données ScienceDirect (qui contient plus de 8 millions d’articles de périodiques scientifiques) renvoie moins d’une trentaine de références. On ne sait pas très bien comment interpréter 1. En informatique, à la différence de l’aéronautique, une boîte noire est un modèle logique où les informations entrent et ressortent sans que l’on ait une idée du traitement qu’elles ont subi à l’intérieur. 2. Faut-il avoir peur de Google, documentaire de Sylvain Bergère et Stéphane Osmont, Arte, 2007 3. www.google.fr/support/webmasters/bin/answer.py?answer=34432&topic=8524 4. www.google.fr/support/webmasters/bin/answer.py?answer=35769