Fonctions avancées de Google : 2 – La recherche sur site : premières astuces de syntaxe

Nous avons récemment examiné la fonction de recherche sur un site donné du moteur Google : "site:" (notre actualité du 5 mai), découvrons aujourd'hui plus avant les richesses cachées de cette fonction.

Un peu de syntaxe…

La syntaxe de base de la fonction de recherche sur site est rappelons-le la suivante :

site:nom-du-site

En fait, les possibilités de désignation du "site" sont extrêmement larges et dépassent considérablement la simple désignation d'un site particulier.

La syntaxe complète pourrait donc être présentée selon cette formule un peu complexe mais rendant compte de toutes les possibilités de la fonction :

site:[sous-domaine.][domaine].TLD[/répertoire][/sous-répertoire]

Tout d'abord, ainsi que le suggère le formulaire de recherche avancée de Google, il est possible de cantonner la recherche à un domaine supérieur (TLD ou Top Level Domain) : .com, .fr, .eu…

Rechercher sous un domaine supérieur

C'est ainsi qu'il est par exemple possible de lancer une recherche sur :

site:.edu copyright

soit : https://www.google.fr/#newwindow=1&q=site:.edu+copyright+

qui renverra toutes les occurrences du mots copyright sur les sites universitaires américains et de quelques autres pays (le .edu étant ouvert à tous les pays).

On comprend donc qu'il est possible de restreindre sa recherche à un unique domaine supérieur, ce qui n'a pas forcément un intérêt spécifique, hormis le cas du .edu. Le .fr n'est pas déterminant pour trouver des sites français puisqu'il en existe au moins autant sous les .com, .org ou .eu, notamment.

Rechercher sous le .gouv.fr

Il est en revanche au moins un cas en recherche juridique qui peut s'avérer très puissant et efficace.
Lorsqu'on observe tous les sites ministériels français, ils ont en commun d'être tous logés sous le .gouv.fr (hormis gouvernement.fr, elysee.fr et service-public.fr).
Il peut donc être très commode de grouper dans une seule requête une question qui portera sur tous les sites ministériels, mais uniquement sur ceux-ci.

Par exemple :

site:gouv.fr assurance chomage

soit : https://www.google.fr/#newwindow=1&q=site:gouv.fr+assurance+chomage

Rechercher en incluant un sous-domaine

Il existe encore la possibilité de rechercher, non pas sur la totalité d'un site, mais sur un sous-ensemble de celui-ci, notamment lorsqu'un grand site possède des sous-sites identifiés par un sous-domaine visible.

Le meilleur exemple en droit est celui du site de l'Assemblée nationale.

Le site générique est www.assemblee-nationale.fr.

Mais lorsqu'on navigue un peu dans Google à partir de la requête :

site:assemblee-nationale.fr

soit : https://www.google.fr/#newwindow=1&q=site:.assemblee-nationale.fr

on s'aperçoit qu'il existe plusieurs sous-sites, dont un qu'il peut être intéressant d'explorer à part, celui des questions parlementaires :

questions.assemblee-nationale.fr

C'est ce sous-site qui héberge les bases des questions parlementaires des diverses législatures de la Vème République. C'est donc bien sur ce sous-site qu'il est possible de rechercher dans les questions écrites au Gouvernement. Et comme le site de l'Assemblée nationale ne possède pas les puissants outils de recherche de celui du Sénat, cette fonction est pratiquement incontournable lorsqu'on veut cibler sa recherche sur des questions écrites.

Exemple :

site: questions.assemblee-nationale.fr "artistes interprètes"

soit : https://www.google.fr/#newwindow=1&q=site:+questions.assemblee-nationale.fr+%22artistes+interpr%C3%A8tes%22

Nous découvrirons ultérieurement quelques autres astuces pour tirer le meilleur profit de la fonction de recherche "site:".

Didier FROCHOT