Retour au sommaire du numéro 16 Retour à la page d'accueil de la LBQ
|
par Jean-François Vincent [ jean-francois.vincent@bnf.fr ]
Le domaine des outils de recherche par Internet est très mouvant, du fait de l'évolution rapide d'Internet et de l'enjeu économique considérable que représentent les "portails", souvent centrés sur un outil de recherche. La concurrence technique et commerciale fait donc rage. Comment l'utilisateur peut-il s'y retrouver, s'il ne veut pas s'en tenir à son intuition ou à ses habitudes? Des évaluations indépendantes, fréquentes et facilement consultables, sont indispensables. Une polémique récente sur le volume relatif de Northern Light et d'AltaVista a montré qu'on ne peut pas se fier aveuglément aux affirmations des constructeurs. Mais une évaluation indépendante du volume des bases se heurte à bien des difficultés. L'évaluation qualitative est très délicate également, les outils étant assez différents les uns des autres. Je m'en tiendrai ici à évoquer, trop rapidement, trois ressources importantes pour l'évaluation des seuls moteurs de recherche.
Search engine watch [ http://searchenginewatch.com/ ] Le site bien connu de Danny Sullivan est une référence respectée sur Internet. S'il fournit beaucoup d'informations en tous genres sur les moteurs, il évite prudemment de les classer en fonction de leurs performances. Il propose cependant des outils fort utiles: notamment, Current Size Comparison donnent les dimensions de certains des grands moteurs, et leur évolution depuis fin 95. Search Engine Features Chart associe ces chiffres dans un seul tableau à quantité d'autres données utiles (fraîcheur des index, rapidité de prise en compte des pages soumises aux moteurs, affichage des résultats, etc.) Dans les deux cas, les chiffres sont ceux que fournissent les constructeurs, et non des évaluations contrôlées. Ils ont néanmoins leur intérêt et, pris pour ce qu'ils sont, ne sont pas sujets à caution. La page Search Engine EKGs (="électrocardiogrammes"), enfin, indique la fréquence des visites de six moteurs sur trois sites particuliers. L'analyse des résultats permet de se faire une idée sur le travail d'indexation des moteurs.
Search engine showdown [ http://www.notess.com/search/ ] Greg Notess, "reference librarian" à la bibliothèque de la Montana State University, maintient régulièrement ce très bon site qui, quoique moins riche que celui de Sullivan, permet peut-être plus rapidement que lui de se faire une idée sur les vertus respectives des principaux moteurs. On trouvera notamment d'intéressantes statistiques indépendantes sur leurs tailles relatives et absolues, le taux de recouvrement des bases de données entre elles, le pourcentage de liens morts dans les bases, le dynamisme de la croissance des moteurs, etc. Ces évaluations sont modestes dans leur principe, mais cette simplicité même a quelque chose de rassurant: si l'on reste insatisfait, du moins on sait ce que l'on a reçu.
Abondance [ http://www.abondance.com ] Dernier arrivé, le site d'O. Andrieu est aussi le plus ambitieux et le plus stimulant dans les évaluations qu'il offre - et le seul en français. Il propose deux "baromètres" trimestriels, pour les moteurs multilingues, et pour les moteurs francophones. Dans les deux cas, une même méthode est appliquée. Elle se fonde sur l'évaluation des tailles relatives des bases, sur une évaluation complexe de la qualité des résultats de dix requêtes, et sur l'évaluation des fonctionnalités proposées, le tout synthétisé par une note globale sur 20, ce qui est très pratique. Je dois dire cependant que cette étude, toute intéressante qu'elle soit, me laisse parfois perplexe dans le détail de la méthode employée. Ainsi, il me semble difficile d'évaluer la qualité des résultats de Northern Light sans tenir compte de sa fonction de catégorisation automatique qui, subjectivement, me semble être le moyen par lequel je trouve le plus souvent ce que j'y cherche. Je suis aussi surpris de la relative complexité des recherches choisies ("Je recherche des moyens de faire baisser les impôts payés par mon entreprise", en particulier), ce qui me paraît multiplier les risques de biais en tous genre. On voudrait aussi en savoir plus sur certains aspects de la méthode (comment ont été comptées les réponses dans les différents moteurs? quels mots clés ont-ils été employés?) Il est difficile de juger de la valeur réelle d'une étude comme celle-ci si on ne dispose pas de détails très précis sur la procédure. Il y aurait beaucoup plus à dire sur ce sujet que je ne l'ai fait dans ce bref article. Il reste aussi beaucoup de place pour le travail d'évaluation des moteurs. Cette tâche difficile et lourde est d'utilité publique, pourrait-on dire. On se prend à rêver d'un collectif de bibliothécaires (par exemple!) qui mettrait au point une méthodologie commune et réaliserait régulièrement des tests... |