Révisez vos classiques : les outils de recherche sur Internet

Pour cette fin de semaine, nous proposons des lectures permettant de réviser quelques fondamentaux sur les outils de recherche sur Internet, spécialement sur le Web.

Les articles que nous proposons ici ne sont pas tous récents, mais encore une fois, il s'agit de réviser les principes de base des divers outils, et non de rendre compte de l'actualité la plus immédiate.

Le World wide web : un innovation européenne

Le World wide web (WWW ou Web tout court) a pris son essor en 1993 — non ! le Web n'est pas né de l'armée américaine dans les années 60 ; cette ânerie s'est propagée à partir d'amalgames techniques incompris des vulgarisateurs du phénomème dans les années 90 — à la suite de la création de la norme HTML (Hypertext markup language) en 1989 au sein du CERN (Centre européen de recherche nucléaire, aujourd'hui Organisation européenne pour la recherche nucléaire) entre les mains de  l'anglais Tim Berners Lee et du belge Robert Cailliau — d'où il suit que le Web est une création européenne...

Des outils pour s'y retrouver sur le Web

Dès que plusieurs milliers de sites ont été créés librement sur la toile, la question s'est posée de savoir comment s'y retrouver. Un bilbiothécaire américain a bien aimgé la situation : c'est comme une vaste bibliothèque mondiale dont les livres seraient posés à même le sol, sans classement.
Se sont alors développées plusieurs initiatives concurrentes pour s'y retrouver.

Les répertoires

L'une, basée sur le travail intellectuel de l'homme, a consisté à répertorier tous les nouveaux sites dès leur apparition sur le net. Il suffisait de bien veiller, puis d'espérer que le répertoire ainsi créé devienne la référence, au point que les nouveau venus se déclareraient directement auprès du répertoire en question. Ainsi est né Yet another hierarchical officious oracle, c'est-à-dire le répertoire Yahoo! (le point d'exclamation fait partie de la marque).

Les moteurs de recherche

L'autre, basée sur la technique informatique, a consisté à développer un logiciel chargé d'explorer automatiquement les réseaux, de repérer les nouveaux venus et de les référencer page par page (et non plus site par site), et de surcroît d'analyser le texte intégral des pages de ces sites. Ainsi sont nés les moteurs de recherche, dont le plus célèbre de la première génération fut Alta Vista et pour la 2ème génération, Google, né en juin 1998 et dont la qualité n'a jamais été détrônée depuis.

Les méta-outils

Une troisième initiative a été de grouper plusieurs outils de recherche sous une même interface en ligne, capable d'interroger ces multiples outils à partir d'une seule requête : ce sont les méta-outils — que d'aucuns nomment méta-moteurs, mais le terme nous semble trop ambigu puisque les méta-outils intérrogent aussi des repértoires, voire des encyclopédies (voir Xquick qui intérrogeait Wikipedia — interroge encore ? : l'interface ne mentionne plus les outils interrogés par défaut) — et qu'on peut aussi nommer, directement traduit de l'anglais, méta-chercheurs.

Les agents de recherche

Une quatrième initiative est celle des agents de recherche. Ils assurent les mêmes fonctions que les méta-outils, mais ce sont des logiciels installés sur l'ordinateur de l'internaute, ce qui lui permet de stoker les résultats de ses recherches et de les relancer régulièrement pour les enrichir. Le plus connus de ces outils est Copernic.

À lire

Par-delà cette très courte sytnhèse, il est possible d'approfondir tous ces points grâce aux articles suivants :

Bonnes lectures !

Didier FROCHOT