Le moteur YST

Mais Yahoo! ne se contente pas de reprendre son indépendance en proposant son propre index de pages web. De célèbres moteurs de recherche tels qu'Altavista et All The Web ont abandonné leur technologie au profit de YST. Et le 13 mai dernier, CNN a annoncé le remplacement de la technologie Google par celle de Yahoo! sur son site d'actualité en ligne.
Pour le moment, Yahoo! a décidé de ne pas communiquer la taille de son index mais, selon certaines sources, ce dernier contiendrait plus de 3 milliards de pages web.
Il convient donc de suivre - et d'utiliser - ce nouveau moteur de recherche d'autant plus qu'une lutte sans merci est engagée avec Google qui reste le premier avec ses 8 milliards de pages web indexées (8 058 044 651 exactement, au 19/11/04).

L'indexation des fichiers bureautiques

YST - suivant en cela la logique de Google - peut repérer et indexer dans sa base des fichiers de type bureautique : fichiers Word, Excel, Powerpoint, Txt et bien sûr PDF. YST prend aussi en compte les pages au format XML (RSS et XML).
Il est donc possible de retrouver des informations qui seraient consignées dans des documents de ces divers types, dans la mesure où ces fichiers ont été rattachés à des pages web, ce qui augmente encore la puissance de recherche du moteur.
Google a été le premier moteur à proposer cette fonction. Aujourd'hui Altavista et All The Web - qui sont entrés dans le giron de YST - le permettent également. D'autres moteurs repèrent les liens vers des documents bureautiques, mais n'en indexent pas pour autant le contenu.

Recherche d'informations - principes

Pour soumettre une requête, il suffit de taper un ou plusieurs mots dans la fenêtre de recherche avant de cliquer sur le bouton « Yahoo! Recherche » (ou d'appuyer sur la touche Entrer de son clavier).
Par défaut, un espace entre deux mots équivaut, dans YST, à l'opérateur « ET » (ou « AND »). Pour exemple, la requête :: droit auteur :: lancera une recherche sur les pages contenant tous ces termes mais pas nécessairement à la suite les uns des autres.
YST prend également en compte les expressions. La requête « droit d'auteur » (entre guillemets) donnera des pages contenant la chaîne de caractères «droit d'auteur ».
Par ailleurs, YST ne tient pas compte de la casse des lettres. Toute lettre en majuscule sera donc automatiquement interprétée par le moteur comme une lettre minuscule.

La recherche simple - comprendre et exploiter les résultats

Dans un souci de communication évident, YST a fait le choix de proposer une adresse spécifique (http://fr.search.yahoo.com) pour son outil de recherche web. Interface claire et dépouillée qui n'est pas sans rappeler celle de Google, cette page permet à l'internaute de se concentrer uniquement sur sa recherche sans se perdre dans le fouillis de services proposés sur la page d'accueil de Yahoo! France (http://fr.yahoo.com/) qui permet également de lancer une recherche sur le moteur YST.
Concernant l'interface quasi similaire à celle de Google, celle-ci est en ligne depuis le 17 octobre 2004 - pour la version américaine - et depuis la première semaine de novembre 2004 pour la version francophone. Auparavant, la première interface dépouillée qui avait mis en place la page dédiée à la recherche (http://fr.search.yahoo.com), correspondait plus à la charte graphique historique de Yahoo! (couleurs voyantes, police de caractère des services Yahoo!, etc.). On assiste donc à un glissement progressif de Yahoo! vers un nouveau type de charte graphique revendiqué par Google (sobriété, clarté, simplicité) et qui tend à devenir aujourd'hui une norme dans le monde des moteurs de recherche.

Le site dédié à la recherche offre plusieurs possibilités.
Au-dessous de la fenêtre de recherche, il est possible de choisir d'effectuer sa recherche sur : le web mondial (« Tout le web »), les pages francophones (« en français »), les pages France (« en France »).
Au-dessus de la fenêtre de recherche, différents onglets permettent d'orienter la recherche : « Web » (le Web mondial), « Images » (images publiées sur le Web), « Guide » (le répertoire de Yahoo!), « Shopping » (comparateur de prix) et « Actualités » (Yahoo! Actualités, le service d'actualité lancé par Yahoo!).
L'internaute peut, à tout moment, basculer d'un module à un autre. Ceci grâce à la présence permanente des onglets en haut de la page des résultats.
Selon le type de recherche effectué, YST peut proposer directement un (des) lien(s) vers des rubriques de son répertoire.
Enfin, parfois, YST suggère des mots-clés pour affiner sa recherche : il suffit de cliquer sur un lien pour relancer la recherche.

Lorsqu'une recherche est lancée dans YST, plusieurs éléments importants apparaissent : Le nombre de résultats trouvés par le moteur, le temps de recherche effectué et l'affichage des résultats (à raison de 20 résultats par page, par défaut).

Chaque résultat apporte les informations suivantes :
- Le titre de la page ;
- Un extrait de la page, faisant apparaître en gras, les termes recherchés dans leur contexte ;
- L'adresse du site ;
- Le type de document. Ce sont en majorité des pages html mais YST permet aussi de trouver des documents de type bureautique présents dans des pages web (« PDF », « MICROSOFT EXCEL », etc.).
- Le poids de la page
- La catégorie, si le lien trouvé est référencé dans le répertoire Yahoo!
- Un lien « En cache » qui permet de consulter le contenu de cette page tel qu'il se présentait lors de la dernière exploration par le moteur. Cette fonctionnalité, déjà proposée par Google, est très pratique lorsque le site n'est plus accessible. En mettant en cache les textes de toutes les pages explorées, YST permet donc de retrouver la trace d'informations dont le support a disparu de l'Internet.
- Un lien « Plus de pages provenant de ce site » proposant d'explorer plus en profondeur les pages du site Web.

La recherche avancée - de nombreuses possibilités

YST propose plusieurs fonctionnalités intéressantes pour lancer des recherches plus précises, très proches de celles de Google.
Présent sur la page d'accueil du site, le lien « Recherche avancée » donne accès à un formulaire qui permet d'affiner sa requête.

Ce formulaire présente un éventail important de fonctions dont voici une sélection :
- La possibilité de délimiter la recherche aux pages contenant : tous les mots, exactement la phrase ou au moins l'un des mots. Il est également possible d'exclure des termes (ce qui est déconseillé) grâce à l'option « aucun des mots ». Pour chaque champ, l'on peut délimiter les choix selon trois niveaux : sur la page, dans le titre, dans l'adresse URL.
- La recherche appliquée à n'importe quel type de domaine ou bien à un seul type de nom de domaine uniquement : .com, .edu, .gov, .org ou encore .fr.
- La recherche appliquée à un domaine ou un site donné lorsqu'on sait que des documents se trouvent sur un site dont on connaît l'adresse tout en ne parvenant pas à retrouver le chemin exact du document. Cette fonctionnalité permet donc de limiter la recherche aux pages d'un site donné.
- Le format de fichier. Il est ainsi possible, par exemple, de rechercher uniquement des documents au format PDF, HTML, XML, TXT, XLS, DOC ou encore PPT.
- Limiter la recherche aux sites d'un pays donné.
- Limiter la recherche aux pages rédigées dans une langue donnée. Mais, pour aller encore plus loin dans ce domaine, il est conseillé de cliquer sur le lien « Outils linguistiques » (http://fr.search.yahoo.com/language/fr/language.html) à droite de la fenêtre de recherche. L'utilisateur y trouvera un certain nombre de fonctionnalités très complètes (outil de traduction, recherche dans un Yahoo! local, etc.) et pourra accéder directement aux versions locales de Yahoo! (http://ca.yahoo.com/ pour Yahoo! Canada, http://it.yahoo.com/ pour Yahoo! Italie, http://de.yahoo.com/ pour Yahoo! Allemagne, http://es.yahoo.com/ pour Yahoo! Espagne, etc.).

Enfin, YST offre un certain nombre de petits services qui constituent un indéniable plus et qui participent au succès du moteur de recherche.
Parmi ces services, on peut mentionner :
- La barre d'outils Yahoo! (« Yahoo! Companion Toolbar ») qui permet de lancer des recherches dans YST sans se rendre sur le site du moteur. Comme sur Google, cette « toolbar » (http://companion.yahoo.com/) permet, entre autres, de contraster les termes de recherche dans la page affichée et de faire la chasse aux pop-up qui empoisonnent le surf des internautes.
- L'outil de traduction automatique de pages web (lien « Traduire cette page ») qui gomme les frontières linguistiques et offre ainsi un accès multiplié aux sources d'information.
- Un outil de conversion de fichiers pdf et autres formats bureautiques au format html (lien « Afficher en html »), similaire à celui de Google, pour récupérer plus facilement des textes contenus dans ces documents.

|cc| Fabrice Molinaro - novembre 2004

Fabrice MOLINARO