Comment lire une URL ?

NB : Lire Notion d'URL avant cette fiche

Rappel : quatre zones dans une URL. Nous commentons ici la zone de protocole et celle de nom de domaine qui permettent de mieux comprendre comment on navigue.

Le protocole de transmission

Toujours rédigé selon la forme : protocole://
http = protocole du Web
ftp = protocole de transfert de fichiers, notamment pour les sites de téléchargement de fichiers.
Astuce : À la frappe, il n'est pas nécessaire de taper le protocole et sa ponctuation " http:// ". Cette précaution n'est indispensable que si le protocole est différent (ftp:// notamment). Sinon, le navigateur rétablit de lui-même le protocole par défaut " http ". 

Le nom de domaine

Le nom de domaine est la traduction en clair de l'adresse numérique Internet (adresse IP = Internet protocol) d'un site. Les fichiers de correspondance entre l'adresse IP et le nom de domaine sont présents sur les réseaux et sont nommés bases DNS (Domain name system).

Un nom de domaine se lit de droite à gauche, à partir du nom de domaine supérieur vers le nom de la machine serveur.
Exemples : www.cnil.fr - www.carrefourlocal.org

Entre chaque point de ponctuation réside une donnée.
La donnée la plus à droite est le domaine supérieur ou top level domain (TLD). Ces TLD sont réglementés. Une première réforme a eu lieu en novembre-décembre 1999.

Les TLD actuels :

On distingue les noms de domaines génériques (gTLD - generic TLD) et ceux dits parfois géographiques (ccTLD - country code TLD)

Noms de domaine génériques - gTLD :

Ce sont ceux qui ont été attribués à l'origine, aux USA. Certains restent réservés aux USA, d'autres ont été ouverts à l'international. De nouveaux noms de domaine ont été agréés à la suite de la réforme de 99.
C'est l'ICANN (Internet corporation for assigned names and numbers) qui est responsable de la mise en place des noms de domaine génériques internationaux. Mais la réservation est déléguée à des opérateurs nationaux accrédités (un des points de la réforme de 99).

Domaines génériques réservés aux USA : .gov .mil

Domaines génériques ouverts à tous les pays: .com .net .org .edu

A ces quatre génériques, s'est ajouté le .int (organismes internationaux) et depuis lors bien d'autres.

Noms de domaine géographiques - ccTLD :

Pour tous les pays du globe autres que les USA, des noms de domaine géographiques ont été attribués. Ils ont été utilisés exclusivement avant que les génériques ne soient ouverts hors des USA. Les TLD géographiques reprennent le code du pays concerné sur deux lettres. Cette liste normalisée des codes pays (code ISO 3166) se trouve un peu partout sur Internet. On la trouve notamment sur le serveur de l'ISO (liste en français :
www.iso.org/iso/en/prods-services/iso3166ma/02iso-3166-code-lists/list-fr1.html

Le principal TLD de la France est .fr
Quelques autres TLD courants : .ca = Canada ; .be = Belgique ; .uk = United Kingdom ; .no = Norvège ...

En France, c'est l'AFNIC (Association française du nommage de l'Internet en coopération www.nic.fr ou www.afnic.fr) qui gère les noms de domaine. Ont été crées des sous-domaines qui se placent immédiatement à la gauche du .fr notamment : .gouv.fr ; .asso.fr ; .tm.fr ; .nom.fr  ...
Exemple : www.culture.gouv.fr

Le domaine principal

Placé à la gauche du TLD et/ou de son complément (comme en France). Ce nom désigne en principe, en clair, le détenteur des sites ou du (des) serveur(s). C'est cette zone qui est l'objet de litiges d'attribution de noms de domaine, notamment de cybersquatting (dépôt d'un nom de domaine qui est déjà protégé en marque ou autrement).
Exemple : www.cnam.fr : identifie directement le CNAM comme possesseur de ce domaine (qui groupe en l'espèce plusieurs sites et plusieurs serveurs).

La partie gauche du nom de domaine

Tout ce qui est à gauche du domaine est le sous-domaine. Le principe est que le titulaire du domaine supérieur administre le ou les sous-domaines.
Cette règle est tout à fait exacte pour les TLD déjà vus ci-dessus. C'est l'organisme chargé du domaine .fr (l'AFNIC) qui par exemple administre, en coopération avec les acteurs économiques, les sous domaines du .fr (.gouv, . asso, ... évoqués ci-dessus).
De même, l'hébergeur de pages personnelles Free détient son nom de domaine " .free.fr ". Il peut donc administrer les sous-domaines et ainsi accorder à ses clients, les noms qu'ils demandent (ex. " dfrochot.free.fr ").

Bien des exceptions ont permis de glisser des sous-cas entre le domaine principal et cette partie. On ne peut toutes les examiner. La partie la plus à gauche désigne classiquement l'ordinateur sur lequel le serveur fonctionne. Suivant une tradition remontant à la naissance du Web, la plupart des ordinateurs serveurs Web s'intitulent " www ". Mais c'est en général un alias qui cache le vrai nom de la machine qui parfois apparaît à l'occasion de navigations, par les moteurs de recherche notamment. On verra donc parfois apparaître bose.cnam.fr à la place de www.cnam.fr. C'est donc le même site.

Cela signifie simplement que les informaticiens ont baptisé l'ordinateur du serveur Web principal du CNAM Bose. Au CNAM par exemple, ont été choisis des noms d'astéroïdes pour nommer tous les ordinateurs. Au Sénat, ce sont des noms de chiens de bandes dessinées qui ont cours ! Ainsi Cubitus a-t-il les honneurs du serveur Internet, et Milou ceux de l'Intranet du Sénat... 

Le www n'est pas une fatalité...

Il faut également savoir que le " www " n'est pas une obligation technique. C'est plus une habitude. On voit de plus en plus d'exceptions à cette règle.
Exemples : fr.yahoo.com pour le site de Yahoo ! France ; mais l'alias www.yahoo.fr fonctionne également - fr.news.yahoo.fr pour les Actualités de Yahoo ! France.

Conclusion

Dès l'instant qu'on a compris ces quelques principes, une URL peut révéler tous ses secrets ! Cela permet de se repérer plus efficacement lors de la navigation.

Une stagiaire crut un jour nécessaire de nous contredire lors d'un stage sur l'Internet juridique : nous affirmions qu'on trouvait fort peu de jurisprudence sur le site du Conseil d'État. Et son écran lui prouvait à l'évidence le contraire. Vérification faite, "son" Conseil d'État logeait sous un domaine se terminant par ".lu " : il s'agissait donc de celui du Luxembourg...

|cc| Didier Frochot - décembre 2000 - janvier 2004

Voir aussi :

Nos articles sur les noms de domaine

Didier FROCHOT