Troisième leçon

Résumé des leçons précédentes:

Sur Internet ( le Web), on peut trouver des "chats", des groupes de discussion ( newsgroup ou Usenet) et des listes de distributions ( mailing lists) sur toutes sortes de sujets. Certains outils repèrent les listes de distributions en anglais ( Listz) et en français (Francopholistes). D’autres outils repèrent les forums de discussion en anglais( DejaNews). Mais le Web comprend surtout des sites, des pages, sur tous les sujets possibles et imaginables. Pour fouiller ce fouilli il y a deux façons principales: le robot (Altavista) et le répertoire de sujets (Yahoo) .

Pour Altavista, nous avons appris quelques trucs:

Mettre un "+" avant le mot cherché, parce qu’alors, le robot doit ABSOLUMENT trouver ce mot dans une page avant de la ramener.

Mettre des guillemets " " lorsqu’il y a deux mots pour obliger le robot à ramener uniquement les pages où les deux mots sont ensemble et non pas séparés dans une page.

Nous allons maintenant utiliser un autre truc pour faire une recherche encore plus précise. Il s’agit de demander le TITRE d’une page.

Jusqu’à maintenant, les trucs du + ou des guillemets "" oblige le robot à ramener des pages qui contiennent certains mots. Si on cherche des pages sur un sujet précis, plutôt que des pages contenant certains mots, il y a un truc utile, demander au robot de ramener un titre. Lorsque quelqu’un crée un page web, il donne un titre à cette page. Si le titre est "Chocolat" il y aura plus d’informations sur ce sujet que si la page s’appelle "pâtisserie". Pour demander un titre de page il s’agit simplement d’écrire le mot "title" suivi de deux points ( :) suivi de ce que vous cherchez entre guillements.


Exemple:

title:"chocolate addiction"

Ou encore

title: " museum of science"

Voyons maintenant les répertoires. Ils sont particulièrement utiles quand on cherche un sujet vaste. Si vous vous intéressez au Moyen Age et que vous demandez "Moyen Age" dans Altavista, le robot ramène toutes les pages où ces deux mots apparaissent ensemble. Evidemment ce n’est pas classé intelligemment. Pour un sujet très général comme " la Deuxième Guerre mondiale" il vaut mieux utiliser un répertoire.

 

Chercher dans un répertoire

Les premiers répertoires ont été créés par des personnes écoeurées de se promener d’un site internet à l’autre à la recherche d’informations. Ils ont dressé des listes personnelles. Ces listes ont grossi, sont devenues plus complexes et, éventuellement, ont permi de mettre de l’ordre dans le fouillis du Web. Yahoo est peut-être le plus connu de ces répertoires qui comprennent aussi Magellan, Nomade (France) , La Toile du Québec, etc. Il a été mis sur pied par deux étudiants de Stanford au début de 1994 et emploie maintenant plusieurs personnes dont des bibliothécaires, qui recensent des sites web et les classent dans des catégories.

Ces netsurfers professionnels filtrent les sites, les rassemblent, les organisent en catégories de sujets, puis en sous-catégories de sujets, puis en sous-sous-catégories de sujets etc. (par exemple cinéma/musique de film/film de science fiction).

C’est ce qu’on appelle l’organisation hiérarchique par sujets ou encore une arborescence ce qui veut dire que c’est divisé comme les branches d’un arbre.

Chaque répertoire a sa propre façon de choisir des sites et de les organiser. C’est pourquoi ces répertoires sont nombreux. En gros, certains répertoires ratissent large, ce sont les répertoires généraux; d’autres sont spécialisés.

On navigue dans ces répertoires comme on se promène dans les rayons d’une bibliothèque. Il s’agit tout simplement de suivre des liens vers les sujets qui nous intéressent. On se retrouve d’abord devant une liste de sujets: Computers, Entertainment, Business. On clique sur un des sujets. Apparaît une liste de sous-sujets. Si on clique sur ces sous-sujets, apparaît une liste de sous-sous-sujets. Yahoo est le plus connu et le plus populaire des répertoires. Le nom bizarre de Yahoo est simplement tiré des premières lettres de (Yet Another Hierarchically Organized Oracle)

Il y a a plusieurs Yahoo. Il y a le Yahoo général, américain, le Yahoo France, le Yahoo Canada etc.

Yahoo

http://www.yahoo.com

Yahoo (France)

http://www.yahoo.fr/

Yahoo Canada

http://www.yahoo.ca/

Signalons maintenant que les 500 000 sites de Yahoo ne font pas le poids à côté des millions de sites d’Altavista. Mais, et c’est un gros mais, chacun de ces sites a été sélectionné par des êtres humains parmi des milliers d’autres sites. C’est donc la crème d’Internet. Mais Yahoo est parfaitement conscient que 25 000 sites, même crêmeux à l’os, ne pouvaient satisfaire les internautes. Aussi il s’est associé avec un robot "Inktomi" petit cousin d’Altavista et qui fonctionne comme lui. Donc, quand vous allez sur Yahoo Canada ( http://www.yahoo.ca/) , par exemple, vous voyez sur la page une boîte où on peut inscrire une demande de recherche pour le petit robot et une liste de catégories. Réglons d’abord la question du petit robot Inktomi.

J’écris "Shoemaker" (cordonnier ou fabriquant de chaussures) dans la boîte. Le petit robot part aussitôt et me ramène des trucs sur la comète Shoemaker, des compagnies qui s’appellent Shoemaker etc. Rien qui m’intéresse. J’essaie un synonyme parce que le robot ne pense pas, il obéit. Je demande "Cobbler" ( cordonnier). Encore une fois, il me ramène toutes sortes de choses: un film, une annonce de restaurant mais aussi Cobbler Shop Shoes. Rien d’intéressant à priori.

Mais ce qui est spécifique avec Yahoo est le fait qu’en haut de la réponse Cobbler Shop Shoes

on voit, surligné en bleu, une catégorie:

Business and Economy: Companies: Apparel: Footwear: Retail.

Ce qui veut dire que Yahoo a classé cordonnier dans la grande catégorie

BUSINESS AND ECONOMY

puis dans la sous-catégorie: COMPANIES

puis dans la sous-sous catégorie: APPAREL:

puis dans la sous-sous-sous catégorie: FOOTWEAR:

et enfin dans la sous-sous-sous-sous catégorie: RETAIL ( vente de détail)

et donc

BUSINESS AND ECONOMY: COMPANIES: APPAREL: FOOTWEAR: RETAIL.

Ce qui est vraiment intéressant dans le mariage Yahoo-petit robot est justement ce classement en catégories. Inktomi n’a rien trouvé d’intéressant sur les cordonniers mais la catégorie fournie par Yahoo va me permettre d’aller plus loin.

Si je clique sur

Business and Economy: Companies: Apparel: Footwear: Retail.

La phrase apparaît en haut de la page et je peux cliquer sur chaque mot.

Footwear est ce qui se rapproche le plus de ce que je cherche. Je clique sur Footwear: on me fournit des sous-catégories; de souliers pour dames à manufacturiers et associations.

L’utilisation de catégories logiques est le grand avantage de Yahoo!

Ses 500 000 sites ( Pages Web, forums de discussion (newsgroups)), sont regroupés intelligemment en une quinzaine de grandes catégories: Art et Culture, Santé, Sciences et Technologies, Divertissements, etc. Faisons maintenant une recherche sans le petit robot.

Supposons que je m’intéresse au Moyen Age. Dans les 14 grandes catégories, il y a Sciences Humaines. Je clique. Après avoir fait une demande de recherche, les premiers résultats qui apparaissent sont les catégories de Yahoo!.

Je me retrouve devant 28 sous-catégories dont Histoire.

Remarquez, en haut à gauche, il est écrit SCIENCES HUMAINES.

Si je clique sur Histoire je me retrouve devant des dizaines de sous-sous-catégories dont Moyen Age. Remarquez, en haut à gauche, il est écrit SCIENCES HUMAINES. et en dessous, HISTOIRE.

Je clique sur Moyen Age et j’ai encore une dizaine de catégories plus des dizaines de sites classés par ordre alphabétique au bas de l’écran.

Remarquez, en haut à gauche, il est écrit SCIENCES HUMAINES- HISTOIRE, et en dessous MOYEN AGE.

En tout, il y a quelque 25 000 catégories. On continue à cliquer jusqu’à ce qu’on obtienne ce qu’on cherche. Ainsi si on cherche la revue People, on saute d’une catégorie à l’autre: News and Media, puis Magazines.

Si le sujet cherché est relativement précis, on utilise et le robot et les catégories.

Vous voulez faire un voyage en Australie.

On va dans la boîte (Search) on écrit "australia travel" ( pas de guillemets, pas de majuscules).

Un des premiers résultats est la catégorie

Regional: Countries: Australia: Recreation and Sports: Travel.

Voilà! On clique.

On utilise Yahoo! pour trouver des sites similaires.

Exemple: vous adorez le jeu d’ordinateur Myst. Et vous cherchez des jeux similaires. Vous écrivez "myst" dans la boîte de recherche. Cliquez. Regardez le titre de la page

"Top:Recreation:Games:Computer Games:Genres:Adventure:Titles:Myst." Tous ces mots sont des hyperliens ( sauf le dernier parce que nous sommes dans la page "myst") et on peut donc cliquer dessus. Cliquez sur l’avant-dernier mot "Titles." Voila! Vous avez une liste de jeux d’ordinateur semblable à "myst"

Remarque: si Yahoo! ne trouve rien dans sa banque de données, votre demande est automatiquement envoyée au robot qui va aller faire le tour de millions de pages web.

Même si Yahoo! a trouvé des catégories et des sites qui vous conviennent, ce n’est pas mauvais de vérifier ce que Inktomi peut trouver. Pour ce faire, cliquez sur "Web Pages" au-dessus de la page de résultats.

Yahoo est un répertoire général; il ne s’occupe pas plus des sites sur le Moyen Age que de ceux sur la santé. Pour aller à fond dans une recherche, il faut consulter des répertoires spécialisés. C’est ce que nous verrons prochainement.

 

 

 

En manchettes sur le Net

La Science d'ici et d'ailleurs

Le Kiosque

Science pour tous

Hebdo-Science

Meilleurs sites en science

Bric--Brac

CyberExpress

C'est quoi l'ASP

Hommages ...

La Qute des origines

Le Monde selon Goldstyn

Questionnaire

 

retour au contenu

Accueil | Hebdo-Science | Le Cyber-Express | Bibliothécaire Québécois | plan du site