Dunod - Les dix plaies d'Internet Dominique Maniez - Le fantasme de la totalité - page 14
plus performant qu’une indexation humaine. Cette idée est extrêmement pernicieuse car elle laisse penser que certaines opérations intellectuelles sont totalement automatisables. Or, jusqu’à preuve du contraire, on a rarement fait mieux pour indexer un livre qu’un être humain ; pour réaliser cette opération, certains gouvernements vont même jusqu’à rétribuer des personnes qu’en termes techniques on désigne sous le nom de bibliothécaire… Il faut enfin noter que lorsqu’il est possible de télécharger le fichier PDF d’un ouvrage complet, on obtient un PDF en mode image et non pas en mode texte ; on en conclura que Google garde pour lui le résultat de la reconnaissance optique de caractères. Un chercheur qui voudrait ainsi travailler sur le texte d’un ouvrage ancien serait donc obligé de ressaisir le texte du livre ou bien de procéder lui-même à la reconnaissance optique des caractères à partir du fichier PDF. Google veut bien être charitable, mais il ne partage pas toutes ses richesses. Cela n’empêche pas aujourd’hui une trentaine de bibliothèques (dont plusieurs bibliothèques européennes) d’être partenaires de Google. L’irrespect du droit d’auteur Comme on vient de le voir, Google ne s’embarrasse pas vraiment des contraintes juridiques du droit d’auteur dans son projet de bibliothèque virtuelle. Cette attitude est en fait un trait de caractère général qui se retrouve à tous les niveaux, quel que soit le support informationnel en cause. C’est un peu comme si l’objectif d’organiser toute la connaissance du monde permettait de s’affranchir des règles du droit d’auteur, en vertu du principe que la fin justifie les moyens. Google part du principe qu’il n’est qu’un intermédiaire technique entre l’internaute et la connaissance qu’il se charge de classer et d’indexer. Google considère donc qu’il n’a pas à rémunérer les producteurs d’information sur le dos desquels il engrange tous ses bénéfices. Cette attitude lui a bien entendu valu de nombreux procès. Le service qui cristallise le plus de griefs est Google News, service qui a été imaginé par un ingénieur de Google sur ses fameux 20 % de temps de travail pendant lesquels les salariés de Google planchent sur les projets qui les intéressent. Google News est un moteur de recherche dédié aux informations fournies par les agences de presse et les journaux en ligne et il permet de se forger en quelques minutes une revue de presse sur le sujet qui nous intéresse. Le seul problème est que Google News ne se contente pas d’indexer, mais qu’il stocke aussi des copies des informations qu’il n’a pas produites et dont il n’est pas propriétaire. En effet, grâce à sa fonction de cache des pages Web, c’est-à-dire de mise en mémoire de toutes les informations qu’il récolte, Google pose de nom-