En naviguant sur l'Internet, nous sommes régulièrement amenés à trouver des documents intéressants pour sa vie personnelle et/ou professionnelle. Selon l'usage que l'on compte en faire, il existe un certain nombre de moyens pour récupérer du texte sur des pages web.

Cinq méthodes sont possibles :

1. La méthode du copier-coller classique dans un traitement de texte

Sélectionner la partie de texte à copier à l'aide de la souris comme dans un traitement de texte.
Activer l'option Copier (Menu Édition / Copier ou le raccourci clavier Ctrl+C).
Ouvrir un logiciel de traitement de texte comme Word pour pouvoir récupérer le texte et le retravailler à sa convenance.
Coller le texte sélectionné (Menu Édition / Coller ou le raccourci clavier Ctrl+V).

Attention, la sélection se fait de manière un peu brute. Et, en cas de multi-colonnes, par exemple, c'est l'ensemble des textes de chaque colonne qui est capturé. Ainsi, lorsque l'utilisateur travaille avec Word, il faudra alors faire le tri, une fois la copie effectuée. En effet, il faut bien comprendre que Word prend en compte les enrichissements graphiques et la mise en page voulus par le concepteur du document initial. Les tableaux, les cellules, la police de caractères ou les parties de texte en couleur réapparaîtront tels quels dans Word. L'utilisateur devra donc parfois prendre un peu de temps pour remettre en forme le texte pour son usage final.

:::: Astuce
Une astuce consiste à utiliser un éditeur de texte tel que le Bloc-notes (Menu Démarrer / Programmes / Accessoires / Bloc- notes). Ce dernier est un logiciel qui gère uniquement du texte brut (format TXT).
Il suffit alors de coller - dans le Bloc-notes - le texte sélectionné sur une page web pour que disparaissent enrichissements graphiques et mise en page du document initial. Enfin, il ne reste plus qu'à copier/coller à nouveau le texte ainsi récupéré mais cette fois-ci dans un logiciel tel que Word. L'utilisateur peut désormais retravailler la présentation du document tel qu'il l'entend.
Malgré une petite manipulation supplémentaire, cette astuce offre souvent à l'utilisateur un gain de temps considérable.

Il est également possible d'enregistrer des documents à partir du navigateur web. Les méthodes décrites ci-dessous valent pour Internet Explorer (à partir de la version 5).

2. Enregistrer la page web dans le navigateur : méthode Microsoft

Le navigateur Internet Explorer (à partir de la version 5) permet d'enregistrer la page web.
Par défaut, il permet de capturer l'intégralité de la page, avec tous ses attributs graphiques, notamment images, puces, fonds d'écran.

Pour ce faire :
Aller dans le menu Fichier / Enregistrer sous...
Une boîte de dialogue s'ouvre proposant, par défaut, le titre de la page web (et non son nom de fichier) comme nom sous lequel le fichier de la page sera enregistré, et le type d'enregistrement de page avec, par défaut, l'option sélectionnée Page web complète.
Le cas échéant modifier l'intitulé du fichier, choisir l'emplacement où l'ensemble sera enregistré et cliquer sur Enregistrer ou taper sur la touche Entrer du clavier.

Cette méthode est lourde, car il est très souvent inutile de récupérer ainsi l'ensemble d'une page avec toutes ses images et fond d'écran.
De plus, elle présente l'énorme désavantage de créer à l'insu de l'utilisateur un dossier du même nom que la page enregistrée et au même endroit que celle-ci, qui contiendra tous les attributs graphiques de la page. D'où un gaspillage de place sur le disque dur ainsi qu'un enchevêtrement de sous-dossiers qui devient très vite d'autant plus perturbant qu'ils sont créés automatiquement sans l'intervention de l'utilisateur, méthode bien dans le style de Microsoft...
C'est pourquoi nous préférons nettement les autres méthodes proposées mais qu'il faut hélas spécifier à chaque usage car, par défaut, le navigateur revient toujours à l'option Page web complète.

3. Enregistrer la page web dans le navigateur : méthode allégée

Repartir du menu Fichier / Enregistrer sous... (hélas, pas de raccourci clavier pour cette fonction).
La boîte de dialogue s'ouvre proposant, par défaut, le titre de la page web (et non son nom de fichier) comme nom sous lequel le fichier de la page sera enregistré, et le type d'enregistrement de page avec, par défaut, l'option sélectionnée Page web complète.
Le cas échéant, modifier l'intitulé du fichier et l'emplacement d'enregistrement de celui-ci.
Mais surtout modifier le type de fichier et choisir Page web HTML uniquement.
Cliquer ensuite sur Enregistrer ou taper sur la touche Entrer du clavier.

Cette option a pour effet de n'enregistrer que le fichier de la page sans ses attributs graphiques (images et fond d'écran). À la relecture donc, l'utilisateur retrouvera le texte de la page mais aux lieu et place des images et autres graphiques, il trouvera le symbole de « l'image cassée » soit la petite croix de Saint-André rouge. Mais dans la plupart des cas, c'est largement suffisant pour réutiliser l'information qui est sur la page.
Cette méthode est très utile notamment quand il s'agit simplement de garder une trace du texte sans avoir besoin nécessairement besoin de l'environnement graphique initial.

4. Enregistrer la page web dans le navigateur : archive Internet Explorer

Repartir du menu Fichier / Enregistrer sous...
La boîte de dialogue s'ouvre proposant, par défaut, le titre de la page web (et non son nom de fichier) comme nom sous lequel le fichier de la page sera enregistré, et le type d'enregistrement de page avec, par défaut, l'option sélectionnée Page Web complète.
Le cas échéant, modifier l'intitulé du fichier et l'emplacement d'enregistrement de celui-ci.
Mais surtout modifier le type de fichier et choisir Archive web... (extension propriétaire .MHT).
Cliquer ensuite sur Enregistrer ou taper sur la touche Entrer du clavier.

Cette option a pour effet d'enregistrer la page web avec tous ses attributs graphiques dans un seul fichier dans un format propre à Internet Explorer. Cela permet de garder trace de la page sans avoir à accumuler des dossiers annexes sur son ordinateur.
Attention : ce système est propre à Internet Explorer, ce qui veut dire qu'il n'est pas possible de relire un fichier .mht sous un autre navigateur qu'Internet Explorer. Donc, pour envoyer un fichier de ce genre par courrier, ce qui est très pratique, il faut s'assurer à l'avance que le correspondant dispose bien d'Internet Explorer pour relire le fichier.

5. enregistrer la page web dans le navigateur : fichier texte

Repartir du menu Fichier / Enregistrer sous...
La boîte de dialogue s'ouvre proposant, par défaut, le titre de la page web (et non son nom de fichier) comme nom sous lequel le fichier de la page sera enregistré, et le type d'enregistrement de page avec, par défaut, l'option sélectionnée Page web complète.
Le cas échéant, modifier l'intitulé du fichier et l'emplacement d'enregistrement de celui-ci.
Mais surtout modifier le type de fichier et choisir Fichier texte... (extension .TXT).
Cliquer ensuite sur Enregistrer ou taper sur la touche Entrer du clavier.

Cette option a pour effet d'enregistrer le contenu de la page Web sans aucuns attributs graphiques. Très pratique pour ceux que seul le texte intéresse, cette méthode se rapproche de celle évoquée dans le point 1. Une fois le document récupéré au format brut, l'utilisateur peut aisément retravailler la présentation du document tel qu'il l'entend.

|cc| Didier Frochot & Fabrice Molinaro - novembre 2004