il n’est cependant pas certain que la qualité de la numérisation soit parfaite
et des personnes commencent à s’en plaindre1.
Mais critiquer ce projet énerve franchement son promoteur, Adam
Smith (j’ignore s’il a un lien de parenté avec l’auteur de Recherches sur
la nature et les causes de la richesse des nations) qui est cité dans un article2
très éclairant du Point sur l’état d’esprit de Google :
« Faites-nous confiance. Nous savons ce que nous faisons. Si vous
vous y opposez, c’est que vous n’avez rien compris ». « Les auteurs ne
comprennent pas ce qui est bon pour eux ».
C’est un peu la marque de fabrique de Google : on est toujours persuadé
d’être dans le vrai et on ne supporte pas vraiment la contradiction.
Dans le même article du Point, un dirigeant de Google, Richard
Chen assène également :
« Si nous considérons que ce que nous faisons est bénéfique pour le
monde, c’est donc que ça l’est ». Personnellement, j’ai toujours une certaine
réticence à l’égard des gens qui aiment dicter ce qui est bon pour
moi. Le fantasme de la totalité se transformerait-il en monstre
totalitaire ?
Il est enfin un dernier point qui a été peu souligné par les personnes
critiquant le projet de numérisation de Google : l’idée sous-jacente que
la recherche en texte intégral est le meilleur moyen d’exploiter le texte
d’un livre. On peut formuler la question autrement : est-ce que les
algorithmes de Google pour rechercher dans un livre permettent bien
d’obtenir des résultats pertinents ? Encore une fois, on ne sait pas très
bien comment tout cela marche, mais on peut imaginer que la principale
méthode de recherche consiste à repérer dans le texte du livre (qui
a été reconstitué par une opération de reconnaissance optique des
caractères à la suite de la numérisation par le scanner) les mots que
l’utilisateur aura saisis dans sa requête. C’est d’ailleurs bien ce que
laisse penser la phrase d’accroche qui s’affiche sur la page d’accueil de
Google Recherche de livres (nom français de Google Book Search) :
« Lancez des recherches sur l’intégralité du texte des livres et découvrez
de nouveaux ouvrages ».
Cette mise en avant de la recherche en texte intégral risque
d’accréditer la thèse auprès du grand public (et de certains informaticiens)
que seule l’indexation automatique permet d’effectuer une
recherche documentaire. En d’autres termes, un algorithme serait bien
1. http://firstmonday.org/issues/issue12_8/duguid/index.html
2. http://www.lepoint.fr/content/economie/article?id=23431