La Lettre du bibliothécaire québécois
Numéro 5 - Octobre 1997


Retour au sommaire du numéro 5


Retour à la page d'accueil de la LBQ


Ecrivez à la LBQ



L'Agence Science-Presse est fière d'héberger La Lettre du bibliothécaire québécois


4. UNE CLASSIFICATRICE DE LA TOILE NOUS PARLE DE SON METIER


La Lettre ouvre ses colonnes, non seulement aux bons webmestres, mais aussi aux collègues qui, par leur professionnalisme, facilitent la consultation des outils de recherche sur le web. Nous avons le plaisir d'accueillir Stéphanie Simard [ ssimard@netgraphe.qc.ca ] de la Toile du Québec [ http://www.toile.qc.ca/ ].

La Toile du Québec est, d'après les derniers résultats des enquêtes du RISQ (mars 97), le site le plus visité par les internautes québécois. C'est aussi, comme l'écrit La Presse du 10 septembre, un des rares sites au Québec à entrer dans ses frais. Parmi les facteurs qui concourrent à ce succès, se trouve une classification tout à fait remarquable. Ceux qui ont eu à se frotter aux classifications réalisées par des programmeurs ­ voir, par exemple, celle de Francité [ http://www.i3d.qc.ca/ ] avec ses innommables chaînes classificatoires du genre "Affaire et Économie : Finance : Assurance : Investissement : investissement " ­ savent à quoi ils échappent en consultant la Toile du Québec.

Voici donc le texte de Stéphanie Simard, que nous remercions pour sa collaboration.

***


Une bibliothécaire à La Toile du Québec [ http://www.toile.qc.ca/ ] ? Et pourquoi pas ! Bien que sur le Web, on parle plutôt de Cyberthécaire. En effet, pas de bibliothèque ni de centre de documentation; du moins rien de palpable. Les documents sont là devant moi, sur mon écran : des sites. Première tâche : établir un système de classification et là je me rends bien compte que les seuls systèmes étudiés lors de mon passage à l'EBSI s'avèrent peu utiles. Il y a bien des exemples d'applications du système Dewey [ http://www.oclc.org/oclc/fp/fptxthm.htm ] pour classement des sites Web (voir la BNC à l'adresse
[ http://www.nlc-bnc.ca/caninfo/fcaninfo.htm ]) mais ils ne sont pas adaptés pour un répertoire comme La Toile du Québec. La principale contrainte étant (si on exclut les ressources limitées) la nature même du contenu du répertoire.

En effet, l'objectif étant de répertorier l'ensemble des sites québécois, on y trouve donc un peu de tout (sauf ce qui a trait à la pornographie, aux activités illicites et à la discrimination). Les sciences n'occupent pas la plus grande part du répertoire; il y a de nombreux sites commerciaux, des sites sur l'informatique et l'Internet, des pages personnelles, etc. Comme tout le monde peut éditer du contenu, le Web devient le reflet de l'activité humaine.

Le caractère instable de ce contenu constitue également une contrainte. Pour 200 à 250 nouveautés dans une semaine, il y a entre 10 et 20 liens qui ne sont plus valides. Heureusement il existe quelques outils pour nous simplifier la tâche comme le Cyber Spyder Link Test qui repère les liens inactifs. La nature précaire du contenu et la quantité de sites traités ont un impact direct sur le processus d'indexation. Celui-ci est limité à la validation des informations et au classement dans la catégorie appropriée. Les mots-clés de même que les descriptions sont soumis par l'éditeur du site au moment de l'inscription.

Toutes nos bases de données sont sur Access, un système qui fonctionnait bien au début, mais maintenant, avec plus de 15 000 sites, la gestion est un peu lourde. C'est donc MS-SQL Server 6.5. qui viendra à notre rescousse pour nous offrir des modules de gestion plus ergonomiques et un nouvel outil de recherche.

De beaux projets pour l'automne, et un emploi du temps bien serré. Et là je ne vous ai parlé que d'une partie de mon travail, l'autre étant la recherche d'information sur Internet !

 

Pour revenir au sommaire du numéro cinq...