Vous êtes ici :

Bibliothèques traditionnelles, bibliothèques virtuelles : ruptures et continuités : Interview de Dominique Lahary

Par ,
Savoirscdi, décembre 2002

Mots clés : bibliothèque , document électronique

Dominique Lahary
Dominique Lahary

Qui êtes-vous et quelles sont vos fonctions ?

Dominique Lahary
Je suis directeur de la bibliothèque départementale du Val d'Oise. Elle a hérité de l’Etat, comme tous ses équivalents des autres départements, dans le cadre de la décentralisation de 1986, une mission d’aide à la lecture publique rurale par la fourniture de documents par dépôts aux bibliothèques et écoles des communes de moins de 10 000 habitants. Mais le Conseil général lui a donné des missions nouvelles, comme l’intervention en milieu urbain dans le secteur de la petite enfance ou dans les quartiers, mais aussi l’animation d’un réseau documentaire départemental, RéVOdoc (http://www.valdoise.fr/7873-avec-revodoc-votre-bibliotheque-est-aussi-grande-que-le-val-d-oise.htm).

Je participe par ailleurs à divers groupes de travail tournant autour de l’utilisation des nouvelles technologies dans les bibliothèques et prends part à la vie associative professionnelle (Association des bibliothécaires français, Association des directeurs de bibliothèques départementales de prêt), notamment sur ces questions.

Bibliothèques traditionnelles / bibliothèques virtuelles : pouvez-vous préciser la notion de bibliothèque virtuelle ?

Dominique Lahary
Je pense que cette expression est floue et le plus souvent ne fait pas sens. Si l’on veut parler d’un organisme qui a constitué une collection de ressources numériques, alors je préfère parler de « bibliothèque électronique ». Une bibliothèque est, selon l’expression consacrée, une collection organisée de documents... ce qui suppose un organisateur, ou une équipe organisatrice. On peut organiser une bibliothèque électronique comme on organise une bibliothèque de documents dits physiques : livres, disques compacts, cédéroms, DVD, etc. Je veux bien qu’on parle de bibliothèque virtuelle pour des ensembles qui n’existent pas en tant que tels, mais sont vus par l’utilisateur comme une bibliothèque organisée. Ainsi d’un service de repérage et de classement de ressources réparties, constituées pour des utilisateurs ou par un utilisateur pour lui-même. En ce sens ce qu’on appelle les « catalogues de signets », mais aussi les annuaires de sites et pourquoi pas les moteurs de recherche sont, pour l’utilisateur, des bibliothèques, que nous appellerons virtuelles puisqu’elles n’existent pas en tant que telles.

Quelles ruptures ?

Dominique Lahary
Dans les bibliothèques électroniques, la rupture c’est l’accès direct en ligne, à la ressource primaire, alors qu’auparavant l’informatique ne servait qu’à gérer les informations secondaires (les catalogues). Vous avez remarqué que je range les collections de documents électroniques portables (cédéroms, DVD) dans les bibliothèques traditionnelles : la véritable rupture, c’est l’accès à des ressources primaires en ligne.
Quant aux bibliothèques virtuelles telles que je les ai définies, elles opèrent une mutation radicale : l’organisation des accès est déconnectée de la gestion des collections. Ce ne sont pas les mêmes acteurs qui interviennent. Le stade ultime, c’est l’organisation des ressources par l’utilisateur final.

Quelles continuités ?

Dominique Lahary
Les continuités me paraissent aussi fortes que les ruptures.
La bibliothèque électronique peut être organisée comme une bibliothèque traditionnelle, à ceci près que le catalogage peut être remplacé par une indexation du texte intégral et/ou de métadonnées présentes dans la ressource ou extraites de celle-ci, ce qui supprime le catalogage en tant que production autonome d’information secondaire.
Mais dans les bibliothèques virtuelles également, les ressources peuvent être décrites, classées, recherchées.

 

Les ressources de l'Internet sont-elles bibliothéconomiquement traitables ?

Dominique Lahary
C’est finalement la même question que la précédente, si l’on admet qu’Internet est toutes sortes de choses (un terrain de jeu, un champ d’action pour mafias diverses, un espace de communications interpersonnelles, un outil de travail en commun à distance, une collection de supermarchés et de petites boutiques) mais constitue aussi, finalement, la bibliothèque virtuelle par excellence dont les ressources peuvent être décrites, traitées, accédées : nous avons là les fondamentaux de la bibliothéconomie. Seulement, une partie des processus est automatique. Mais n’oublions pas :
- qu’un annuaire de sites comme Yahoo est le résultat d’une activité humaine,
- que les moteurs de recherche en texte intégral reposent sur une base de données, tout comme un catalogue... et que leur développement est aussi le résultat d’un travail humain.

 

Existe-t-il une nouvelle bibliothéconomie?

Dominique Lahary
Encore une fois les fondamentaux sont les mêmes. Ce qui change c’est le cadre normatif (tout se concentre vers XML et ses diverses applications), l’importance de l’indexation automatique, la disparition partielle de la notion de catalogue comme entité séparée des ressources primaires. Je pense que cette nouvelle bibliothéconomie, qui progresse grâce aux documents électroniques, aura des retombées sur la bibliothéconomie du document primaire dit physique. C’est en tout cas mon souhait : les catalogues de bibliothèques devraient davantage ressembler aux outils de recherche des ressources du web.

Quelle place pour le document secondaire dans le contexte du numérique en ligne ? Est-il encore utile ?

Dominique Lahary
Puisqu’il y a une base de données à la base d’un moteur de recherche, il y a des documents secondaires, même s’ils sont constitués automatiquement. C’est l’idée de saisir humainement une description d’un document déjà électronique qui,à juste titre, est remise en cause. Même pour les livres imprimés ce serait possible, puisqu’ils sont numériques de naissance... s’il n’y avait rupture de la chaîne numérique en raison d’intérêts économiques et aussi du fait que les professions du livre n’ont pas l’habitude de travailler ensemble. Je suis très sceptique sur nombre de répertoires de signets constitués par les bibliothèques, qui témoignent de la persistance de documents secondaires dans un contexte numérique, de l’envie d’en faire plus que de leur utilité. Ces répertoires sont sans doute irremplaçables dans des domaines très spécialisés, mais dans un contexte généraliste, l’expérience montre que les utilisateurs n’en ont que faire et préfèrent utiliser les outils connus de tous.

Ne va-t-on pas vers une moindre importance des langages documentaires pour l'usager ?

Dominique Lahary
On peut décrire un langage documentaire comme un intermédiaire entre l’usager et le document. Or le langage du document est généralement plus proche de l’usager que cet intermédiaire qui fait écran. C’est pourquoi l’indexation du texte intégral est utile, malgré le bruit, à condition d’utiliser une pondération pertinente pour trier les résultats. Google a prouvé l’incroyable efficacité de son principe (pondération sur le nombre de liens pointant vers la ressource) dans la plupart des cas. J’ai dit « la plupart », pas tous. Ceci est vrai aussi pour les documents dits physiques : je crois à l’indexation des résumés, des tables des matières, plutôt qu’au raffinement des systèmes d’autorité matière comme on dit. Mais dans un domaine intellectuellement délimité et spécialisé, les langages documentaires peuvent conserver leur utilité. De même que l’expression normalisée des auteurs, par exemple. Mais je ne me fais pas de soucis pour l’avenir des référentiels liés à un intérêt juridique et économique !

Pour le documentaliste ?

Dominique Lahary
Ce qui est bon pour l’usager l’est aussi pour le documentaliste, qui est au service du premier

Peuvent-ils être utilisés dans le cadre de métadonnées ?

Dominique Lahary
Bien sûr. Les métadonnées sont une nouvelle figure du catalogage (si elles sont distinctes de la ressource décrite) ou de la page de titre (si elles en sont partie intégrante). Tout le problème est : qui produit les métadonnées ? Si c’est le producteur du document, comment garantir qu’il utilisera un référentiel cohérent partagé par une communauté ? On peut gérer un langage documentaire cohérent en espace confiné. Dans un contexte ouvert et réparti, c’est très difficile.

On rencontre des difficultés pour identifier les unités documentaires dans le contexte du web. Un site peut-il être lui-même une unité documentaire ?

Dominique Lahary
Ce qui trouble les bibliothécaires et les documentalistes, c’est que tout leur système de référencement, dont le catalogage est le plus beau fleuron, repose sur l’isolement d’unités bibliographiques, au demeurant emboîtables. Les unités bibliographiques classiques sont des objets morts. Le web est vivant. D’une part ça bouge tout le temps, d’autre part on ne sait plus comment découper ce magma. C’est le fameux problème de la « granularité » de l’information. Soyons pragmatiques : un site est une unité, une page est une unité, une série de pages ou une base de données sont des unités, s’il est utile de les identifier et d’y donner accès. Décrire, identifier un site, c’est un peu comme identifier un éditeur, ou une collection de pièces d’archives. Les bibliothécaires n’ont pas l’habitude de décrire au niveau du fonds. Les archivistes, si. Un des aspects passionnants de notre époque, c’est que les frontières entre métiers sont remises en cause. Apprenons les uns des autres !

La norme Z39-50 : quels sont ses atouts, ses limites et ses perspectives ?

Dominique Lahary
Z39.50 est un protocle spécifique, compatible avec TCP/IP, le protocole de base d’Internet, permettant de développer des logiciels clients interrogeant des bases réparties et hétérogènes, et des logiciels serveurs rendant ces mêmes bases accessibles aux clients. Pour rendre ceci compatible avec le web, il faut associer aux clients des interfaces permettant une interrogation à partir d’un navigateur web. Ca marche, incontestablement, même si interroger de multiples bases réparties peut générer des temps de réponse excessifs et des échecs de connexion : arriver à interroger en une seule requête des bases incompatibles entre elles, c’est quand même quelque chose. C’est d’ailleurs un des aspects de la déconnexion entre gestion des ressources et gestion des accès dont je parlais plus haut. Mais le protocole est spécifique et la norme plutôt compliquée, donc les logiciels clients et serveurs ont tendance à être chers. Sous le nom de code ZING (Z39.50 international new generation), le ZIG (Z39.50 Implementer’s group), groupe international qui gère la norme, est en train de rejoindre les standards basés sur XML développés par le W3C (World Wide Web Consortium), qu’il s’agisse de la structure des informations que de celle des messages (le protocole). Nous verrons ce qu’il en adviendra.

On déplore l'instabilité des adresses sur le web. Quelles sont les solutions envisagées ? Qu'en est-il du remplacement de l'URL par un URN (United Resource Names) ? Quel avenir pour le DOI (Digital Object Identifier ?)

Dominique Lahary
Je ne suis pas très qualifié pour répondre à cette question. Le DOI est une sorte d’ISBN du document numérique, résolvant la question de l’instabilité et surtout associable à un tiroir-caisse. Ce système est promu par les éditeurs. Tout ce qui répond à un intérêt économique a de l’avenir s’il correspond à une demande solvable et si tout le monde s’y rallie. En dehors de ce contexte, j’espère comme vous que des solutions émergeront et trouve le temps long.

Comment évolueront de votre point de vue les technologies liées aux sites web (php, java, XML...) et quels avantages et inconvénients voyez-vous aujourd'hui aux pages dynamiques et à l'organisation des sites en bases de données ?

 Dominique Lahary
Java n’a pas eu le développement hégémonique promis au milieu des années 90 mais il subsiste, de même que java script, qui, lui, s’intègre dans des pages HTML. Tout cela va dans le sens de la consécration du navigateur web comme client léger universel. Cela ne peut que se développer. C’est vraiment le web qui donne le ton dans la gestion électronique, et l’organisme créateur de standard le plus important au monde, c’est le W3C. XML, enfant du W3C, est beaucoup plus qu’un successeur d’HTML : c’est en passe de devenir le modèle générique de structuration de l’information, mais aussi des messages entre machines (c’est le sens de l’évolution de Z39.50), partagé par toutes les professions utilisant de l’information électronique, même s’il faut sur cette base inventer des répertoires d’éléments et des syntaxes (DTD, schémas XML). C’est ce que j’appelle la globalisation documentaire, qui est un des aspects de la globalisation (ou mondialisation). C’est un tournant historique considérable. PHP, qui ne doit rien au W3C puisque c’est l’invention d’un individu, de même que ASP proposé par la firme Microsoft, représentent l’intégration des bases de données avec le web : toujours le client universel ! Cela simplifie l’interrogation de bases à partir d’un navigateur, quand auparavant on devait développer des passerelles parfois en plusieurs couches, comme dans l’exemple de Z39.50 ancienne manière. La simple gestion d’un site web est un des domaines d’application de ces techniques. J’étais auparavant très attaché à la notion de web statique : un réflexe de bibliothécaire ou de documentaliste attaché au document à l’ancienne, qui est fixe et comporte à la fois le contenu et sa présentation. Je suis obligé de reconnaître que la gestion des sites en bases de données simplifie énormément le travail : comment être contre ? PHP s’est vraiment répandu comme une traînée de poudre, chapeau ! Ce qui me soucie maintenant c’est que soit préservée la possibilité de poser un lien vers une ressource, une unité documentaire, à l’intérieur d’un site, sans qu’on soit obligé de passer par la page d’accueil. C’est cela la logique documentaire : pouvoir accéder directement à un document Sur le web, c’est l’URL qui le permet, vaste système international de cote. Or il existe deux sortes de gestion en base de données des sites web : ceux qui permettent de poser un lien vers une ressource et ceux qui ne le permettent pas. Un lien vers un document situé dans un site géré en base de données peut parfaitement être exprimé à l’aide d’un URL stable, même si cet URL comporte dans son expression la formulation de la requête. Par exemple : Ouvre ce lien externe dans une nouvelle fenêtrehttp://alain.caraco.free.fr/index.php?page=opac. Mais il existe des sites qui ne permettent pas de sauvegarder la requête dans un lien. Ces ressources ne sont alors accessibles que si on passe par la page d’accueil, ce qui répond à une logique commerciale ou institutionnelle. Ce sont des portails culs-de-sac, avec entrée obligatoire par le grand escalier et non par la fenêtre. Il existe d’ailleurs un autre phénomène qui fait obstacle à l’accès direct : c’est la gestion en cadres (« frames »), quand les éléments affichés dans les cadres ne permettent pas de savoir où on est ni de remonter à la page d’accueil. Les moteurs signalent ces pages et quand on y accède on ne sait pas où on est. Si la logique de passage obligatoire par les pages d’accueil devait l’emporter, alors c’en serait fini du principe du lien hypertexte entre sites différents qui est à la base de la géniale invention du web par Tim Berners Lee au début des années 1990. Et le web alors ne serait plus une bibliothèque. Le bibliothécaire que je suis le déplorerait, mais je crois que l’utilisateur aussi y aurait beaucoup perdu.

dominique.lahary@valdoise.fr
site professionnel : Ouvre ce lien externe dans une nouvelle fenêtrehttp://www.lahary.fr/pro/
Bibliothèque départementale du Val d'Oise 28, av. du Général-Schmitz - F - 95300 PONTOISE

Recherche avancée