Créer des documents PDF avec des pages web dans Open Office

Linux Gazette n°99 — Février 2004

Willy Smith


Table des matières
1. Chargement des fichiers
2. Nettoyage et table des matières

Peut-être avez-vous le même problème que moi — une connexion Internet lente, qui entraîne beaucoup de frustration et l'apparition de nouvelles habitudes de navigation sur le Web. L'une d'entre elles est de télécharger des documents et de les lire hors connexion. Grâce à wget, je télécharge facilement sur mon ordinateur une partie d'un site qui m'intéresse et je l'explore plus tard. Mais pour transmettre ces pages à quelqu'un d'autre, cette méthode est encore peu pratique. J'ai donc décidé que le moyen le plus simple serait de convertir le document au format PDF, celui d'Adobe Acrobat™ : cet article est un court tutoriel sur l'utilisation d'Open Office pour ce faire. Je cherchais en particulier un livre sur la sécurité, surtout après avoir récemment subi une attaque de mon pare-feu. J'ai réalisé que je ne comprenais pas encore beaucoup de choses sur Linux, et je voulais à la fois apprendre par moi-même et diffuser l'information. Il m'est arrivé de parcourir le « Guide sur la Sécurité de l'Administrateur Linux » (en anglais LASG, Linux Administator's Security Guide) de Kurt Seifried, disponible au format HTML ici. Il contient beaucoup d'informations intéressantes, dont de nombreuses descriptions de concepts de base et de programmes sur lesquels j'avais peu de connaissances. J'ai donc envoyé un message électronique à Kurt pour savoir s'il ne voyait pas d'inconvénient à ce que je transforme son ouvrage en PDF. Il m'a répondu très rapidement que ce serait une bonne idée et qu'il aimerait en avoir une copie pour lui ; et de toute manière, si je ne changeais rien, il ne pourrait pas y faire grand chose puisque son guide est sous licence OpenContent.org (incluse dans le document).

Je me suis demandé combien de temps cela me prendrait, mais tout s'est avéré très simple sous OpenOffice 1.1. Je pense que le processus complet me demandera certainement moins d'une heure la prochaine fois. Bien sûr, j'y ai passé trois fois plus de temps pour mon premier essai. Voici les étapes à suivre :


1. Chargement des fichiers

  1. Ouvrez le traitement de texte d'OpenOffice.

  2. Ouvrez la page de titre de l'URL dans la fenêtre d'un navigateur (j'ai utilisé Konqueror sous KDE). Le mieux est de disposer d'un écran assez grand pour les deux fenêtres, mais vous pouvez aisément alterner si votre moniteur est trop petit.

  3. Déplacez le curseur de la souris sur le premier lien dans la fenêtre du navigateur, cliquez dessus avec le bouton droit et sélectionnez Copier l'emplacement du lien.

  4. Déroulez le menu Insertion d'OpenOffice et sélectionnez Fichier.... Cliquez avec le bouton droit et collez le lien depuis le navigateur sur la liste déroulante Nom de fichier :, puis cliquez sur Insérer.

  5. La page HTML se télécharge dans votre document et laisse le curseur en attente à la fin.

Répétez maintenant les étapes 3 à 5 jusqu'au chargement complet du document. S'il y a une autre hiérarchie dans le document, cliquez sur son lien dans le navigateur et suivez les mêmes étapes pour cette page. Mais notez la simplicité de l'opération puisque le curseur est toujours en attente sur la bord gauche de la page, à l'endroit de la prochaine insertion.


2. Nettoyage et table des matières

  1. Une fois que vous avez chargé le document entier, explorez-le et vérifiez s'il y a des corrections à faire. Par exemple, j'ai dû tirer la marge droite du document pour pouvoir obtenir un format paysage. Du fait que le fichier est en HTML, les tableaux s'ajusteront tous automatiquement.

  2. Sélectionnez à présent le document entier : appuyez sur Ctrl-Début (le curseur est donc au début de celui-ci), puis appuyez sur Ctrl-Maj-Fin pour sélectionner tout le texte. Copiez alors le texte (Ctrl-c ou Édition -> Copier). Procédez ainsi car les pages sont à ce stade encore sous forme de pages individuelles dans le document.

  3. Créez un nouveau document OpenOffice (Fichier -> Nouveau -> Texte).

  4. Collez le HTML dans le nouveau document (Ctrl-v ou Édition -> Coller).

  5. Supprimez la table des matières incluse dans le document. Placez le curseur à l'endroit où se trouvait le début de cette table des matières.

  6. Ouvrez le menu Insertion, sélectionnez Index -> Index.... Assurez-vous que le titre est bien Table des matières et choisissez Table des matières comme type de table. Vérifiez que la case Structure est cochée dans Créer à partir de et cliquez sur OK. Cette étape peut prendre un certain temps, mais lorsqu'elle est terminée, vous voyez apparaître toutes les entrées et sections de la table des matières originelle suivies des numéros de page.

  7. À ce stade, enregistrez le document en tant que document texte OpenOffice (.sxw). Cette étape risque également de prendre du temps.

  8. Exportez à présent le document au format PDF.

Vous pouvez télécharger le résultat mon premier essai : ici. Il n'est certes pas parfait, mais la qualité est correcte, l'opération n'a rien de difficile et ne prend pas énormément de temps. Du fait que la licence OpenContent ne vous autorise pas à modifier le document originel, cette approche offre un bon moyen de réaliser cette opération sans modifications ni reformatage conséquents.

Merci beaucoup à Kurt Seifried pour son travail sur ce livre. J'espère que vous visiterez son site ou que vous téléchargerez le PDF, car il contient beaucoup d'informations très utiles. Je pense que chacun est responsable de la sécurité de son système, et il s'agit là d'une bonne occasion pour commencer.

Copyright © 2004 Willy Smith.

Copying licensehttp://www.linuxgazette.com/copying.html.

Paru dans le n°99 de la Linux Gazette de février 2004.

Traduction française par Éric Barbero .

Relecture de la traduction française par Joëlle Cornavin .