Créer son propre moteur de recherche avec Google CSE (Custom Search Engine)

Le 10 mai 2006, le célèbre moteur lançait Google Co-op (www.google.com/coop/) qui risque fort de révolutionner la recherche sur l’Internet. En effet, Google Co-op propose une autre approche de l’indexation et de la recherche en s’appuyant sur un réseau de spécialistes, experts d’un domaine. Différents outils sont offerts aux internautes qui peuvent ensuite affiner leurs recherches en fonction de certains critères notamment des labels attribués par ces spécialistes. Ces labels correspondent à des annotations sur le contenu qui renvoient ensuite à des catégories associées aux critères d’indexation.
Si Google Co-op touche encore un public assez limité, une des briques du système est, en revanche, de plus en plus utilisée. Il s’agit de Google Custom Search Engine - ou Google CSE -(www.google.com/coop/cse/) qui apparaît finalement une nouvelle fonctionnalité de Google Co-op.

Lancé le 23 octobre 2006 (googleblog.blogspot.com/2006/10/eureka-your-own-search-engine-has.html), il s’agit d’un moteur personnalisable à destination des webmasters et autres bloggers qui voudraient exploiter la puissance de la technologie Google pour leur site web.
Certes, Google n’est pas le premier à proposer ce type d'outils. Mentionnons, par exemple, Rollyo (www.rollyo.com/), Yahoo Search Builder (builder.search.yahoo.com/) ou encore Eurekster (www.eurekster.com/). Mais Google dispose de certains avantages et son nouveau service se révèle très intéressant.

Créer son moteur de recherche sur mesure


Pour cela, il suffit de disposer d’un compte (gratuit) chez Google. Il faut alors se connecter sur la page d’accueil de Google CSE (www.google.com/coop/cse/) et cliquer sur le bouton « Create a search engine ». Une fois identifié, l’utilisateur accède à un formulaire en ligne qui permet de configurer son propre moteur de recherche. Diverses informations sont demandées : le nom du moteur, une description, quelques mots-clés décrivant le domaine du moteur et la langue utilisée. Puis, il faut indiquer une liste de sites web sur lesquels le moteur lancera sa recherche. Contrairement à Rollyo, par exemple, qui ne permet pas de dépasser 25 sites, Google CSE n’impose pas de limite dans le nombre de sources choisies par l’utilisateur.
Élément important. Google propose deux façons de configurer son moteur personnalisé : soit le moteur est restreint à une liste donnée de sites, soit le moteur lance sa recherche sur tout le web tout en accordant une priorité à sa propre liste de sites.
Par ailleurs, il est possible de permettre à d’autres personnes de contribuer à l’enrichissement de ce moteur. Google propose deux options : soit n’importe qui peut se porter volontaire, soit uniquement des personnes que le créateur du moteur aura invitées.
Une fois ces options validées, l’utilisateur clique sur le bouton « Next » pour être renvoyé vers une page proposant de tester et visualiser le moteur. Puis un clic sur le bouton « Finish » permet de finaliser la configuration. Le moteur de recherche est créé. Cela a pris à peine quelques minutes.

Personnaliser son moteur

Pour accéder à son moteur de recherche, il suffit de cliquer sur le lien « Homepage » et d’enregistrer ce lien dans ses favoris pour accéder facilement à ce moteur de recherche personnel.
Toutefois, Google CSE offre la possibilité d’aller beaucoup plus loin. Le « Control panel » offre un certain nombre d’outils très impressionnants dont voici les plus importants :

L’onglet « Sites » permet – à tout moment – de modifier la liste de sites sur lesquels le moteur lance sa recherche. On peut en ajouter et en supprimer. Mais il est également possible d’exclure des sites (« Excluded sites ») que l’on ne veut pas voir apparaître dans les résultats.

L’onglet « Refinements » permet d’annoter certains sites via des labels (autrement dit des tags) pour mieux orienter la recherche des utilisateurs du moteur. On peut ainsi restreindre une recherche, taguer certains sites en fonction de leur nature ou de leur langue. Certains sites apparaitront alors en priorité en fonction de la requête de l’utilisateur. L’on retrouve ici l’une des fonctionnalités importantes du système Google Co-op. En effet, le responsable du moteur peut attribuer des labels aux sites qu’il aura sélectionnés. Ces labels – qui offrent une autre approche de l’indexation et de la recherche – seront alors susceptibles d’accompagner l’utilisateur dans sa recherche. Ainsi, par exemple, après avoir trouvé un site intéressant et labellisé « Veille », l’utilisateur n’aura plus qu’à cliquer sur le lien du label « Veille » pour affiner sa recherche et accéder uniquement aux résultats issus des sites liés à ce label.

L’onglet « Look and feel »  offre un module de personnalisation graphique du moteur afin que celui-ci colle à la charte de son site. Il est possible d’intégrer son logo mais également de choisir la couleur des éléments (titre, texte, liens, liens visités, etc.) dans les pages de résultats.

L’onglet « Code » fournit le code à intégrer dans son site pour faire apparaître son moteur de recherche. Plusieurs présentations du moteur Google CSE sont alors proposées. Mais il est aussi possible de syndiquer son moteur de recherche en récupérant le code d’un bouton baptisé « Add to Google ». Ainsi, un utilisateur qui serait séduit par la pertinence d’un moteur de recherche Google CSE pourrait cliquer sur le bouton « Add to Google » afin d’afficher ce moteur sur sa propre page d’accueil Google personnalisée.
Enfin, pour accentuer la personnalisation, Google permet de faire apparaître directement les résultats dans une page de son site web. Il convient alors de prévoir une iframe sur son site.

L’onglet « Collaboration » permet de gérer sa liste de contributeurs chargés d’améliorer le moteur de recherche. Nous sommes, à nouveau, dans une logique Web 2.0 avec la mutualisation des connaissances au service de l’amélioration d’un outil. Il est possible d’inviter des contributeurs mais également de recevoir des propositions de collaboration de volontaires qui auront découvert votre moteur.

L’onglet « Make money » permet à ceux qui disposent d’un compte Google AdSense d’afficher des publicités dans les résultats de son moteur de recherche et donc de gagner un peu d’argent.

L’onglet « Advanced » permet notamment de déterminer les annotations incluant ou excluant certains sites des résultats de son moteur de recherche. Ces annotations doivent être compilées au format OPML, XML ou encore TSV.

Si Google n’est pas le premier à proposer aux internautes la création de leur propre moteur de recherche personnalisable, Google Custom Search Engine affiche certains arguments très convaincants.
Google CSE est réellement un outil très complet qui devrait connaître un succès mérité.

|cc| Fabrice Molinaro – avril 2007

Fabrice MOLINARO