plus performant qu’une indexation humaine. Cette idée est extrêmement
pernicieuse car elle laisse penser que certaines opérations intellectuelles
sont totalement automatisables. Or, jusqu’à preuve du
contraire, on a rarement fait mieux pour indexer un livre qu’un être
humain ; pour réaliser cette opération, certains gouvernements vont
même jusqu’à rétribuer des personnes qu’en termes techniques on désigne
sous le nom de bibliothécaire…
Il faut enfin noter que lorsqu’il est possible de télécharger le fichier
PDF d’un ouvrage complet, on obtient un PDF en mode image et non
pas en mode texte ; on en conclura que Google garde pour lui le résultat
de la reconnaissance optique de caractères. Un chercheur qui voudrait
ainsi travailler sur le texte d’un ouvrage ancien serait donc obligé
de ressaisir le texte du livre ou bien de procéder lui-même à la reconnaissance
optique des caractères à partir du fichier PDF. Google veut
bien être charitable, mais il ne partage pas toutes ses richesses. Cela
n’empêche pas aujourd’hui une trentaine de bibliothèques (dont plusieurs
bibliothèques européennes) d’être partenaires de Google.
L’irrespect du droit d’auteur
Comme on vient de le voir, Google ne s’embarrasse pas vraiment des
contraintes juridiques du droit d’auteur dans son projet de bibliothèque
virtuelle. Cette attitude est en fait un trait de caractère général qui se
retrouve à tous les niveaux, quel que soit le support informationnel en
cause. C’est un peu comme si l’objectif d’organiser toute la connaissance
du monde permettait de s’affranchir des règles du droit d’auteur,
en vertu du principe que la fin justifie les moyens.
Google part du principe qu’il n’est qu’un intermédiaire technique
entre l’internaute et la connaissance qu’il se charge de classer et
d’indexer. Google considère donc qu’il n’a pas à rémunérer les producteurs
d’information sur le dos desquels il engrange tous ses bénéfices.
Cette attitude lui a bien entendu valu de nombreux procès. Le service
qui cristallise le plus de griefs est Google News, service qui a été imaginé
par un ingénieur de Google sur ses fameux 20 % de temps de travail
pendant lesquels les salariés de Google planchent sur les projets
qui les intéressent. Google News est un moteur de recherche dédié aux
informations fournies par les agences de presse et les journaux en ligne
et il permet de se forger en quelques minutes une revue de presse sur le
sujet qui nous intéresse. Le seul problème est que Google News ne se
contente pas d’indexer, mais qu’il stocke aussi des copies des informations
qu’il n’a pas produites et dont il n’est pas propriétaire. En effet,
grâce à sa fonction de cache des pages Web, c’est-à-dire de mise en
mémoire de toutes les informations qu’il récolte, Google pose de nom-