
Le 15 avril 2004

Retour
au sommaire des capsules
La mort des hyperliens
(Agence Science-Presse) - L'hyperlien
a souvent été décrit comme une des
inventions les plus formidables du XXe siècle: grâce
à lui, se construit petit à petit une encyclopédie
planétaire. Mais plus les années passent,
et plus l'encyclopédie se révèle aussi
trouée qu'un fromage suisse.
Ainsi, jusqu'à un cinquième
des pages web citées dans des articles de la base
de données Medline auraient disparu ou ne
seraient accessibles que de façon intermittente.
Une page sur cinq, ou 20%.
Et Medline n'est pas n'importe
quoi: c'est la crème de la crème des bases
de données d'articles et de recherches en biologie
et en médecine.
Il y a longtemps que les internautes
se sont habitués au fait que des sites web personnels
disparaissent après quelques mois ou quelques années.
Mais on aurait cru, jusqu'à récemment, que
le milieu universitaire était plus solide: après
tout, une bonne partie de ces sites "hyperliés" par
des articles scientifiques sont hébergés par
des universités; ce sont parfois même des sites
de référence de haut niveau.
Rien de plus faux, affirme le bioinformaticien
Jonathan Wren, de l'Université de l'Oklahoma à
Norman, au terme de son étude parue dans la dernière
édition de la revue américaine Bioinformatics.
Dans un univers où l'information est de plus en plus
électronique, où chercheurs et étudiants
s'appuient de plus en plus sur Internet pour leurs recherches,
c'est inquiétant.
Jonathan Wren ne prétend pas
être exhaustif. Il a passé en revue, au hasard,
quelques centaines de résumés d'articles (abstracts)
recensés dans Medline entre 1994 et avril
2003 et a vérifié les hyperliens cités
en référence. Et c'est dans le cadre de ce
survol statistique qu'il est tombé, dans un cas sur
cinq, sur l'avis si familier aux internautes, "URL not found".
Mais il n'est pas le premier à
tirer la sonnette d'alarme. En novembre dernier, une équipe
dirigée par un dermatologue de l'Université
du Colorado, Robert Dellavalle, avait publié dans
Science
une compilation des adresses Internet citées pendant
deux périodes de six semaines, à la fin des
années 2001 et 2002, dans trois des revues les plus
prestigieuses (The New England Journal of Medicine, The
Journal of the American Medical Association et Science).
Déjà, après trois mois, 4% de ces adresses
n'existaient plus. Après deux ans, la proportion
était passée à 13%, et continuait d'augmenter.
Dans le cas des adresses ".com", la proportion était
de... 46%. Et de 30% pour les adresses ".edu".
Deux autres études, plus sommaires,
étaient arrivées à des conclusions
similaires en 2003: l'une, parue dans Biochemical Molecular
Biology Education, évaluait que 20% des adresses
Internet couramment utilisées aux Etats-Unis dans
le programme scientifique des écoles secondaires,
étaient devenues inactives en moins d'une année
scolaire: soit entre août 2002 et mars 2003. L'autre
étude portait sur 184 adresses Internet relatives
à un médicament, Opuntia: 108 de ces adresses
étaient devenues inactives après quatre ans.
Ce problème ne concernerait-il
que les sciences de la vie? Pas si sûr, admet le physicien
Paul Ginsparg, de l'Université Cornell, qui dirige
le service de pré-publication électronique
arXiv. "Nous avons toujours insisté pour que les
articles soumis à arXiv soient complets et auto-suffisants,
et que les hyperliens externes ne conduisent que vers du
matériel non-essentiel".
En réaction à l'étude
de Jonathan Wren, Robert Dellavalle, qui milite pour un
archivage électronique de meilleure qualité,
a eu ce mouvement d'humeur dans la revue britannique Nature:
"c'est incroyable de voir ce qui n'existe plus; un de mes
propres articles sur la conservation numérique a
disparu!"
Capsule
suivante
Retour
au sommaire des capsules
Vous aimez cette capsule? L'Agence Science-Presse
en produit des semblables -et des meilleures!- chaque
semaine dans l'édition imprimée d'Hebdo-science
et technologie (vous désirez vous abonner?).
Vous voulez utiliser cette capsule? Contactez-nous!
|