Compresser un dossier entier de PDF en lot : méthodes automatisées gratuites
Imaginez que vous avez un dossier contenant 50, 100 ou même 500 fichiers PDF volumineux qui doivent tous être compressés avant d'être archivés ou partagés. Compresser chaque fichier manuellement un par un prendrait des heures. La compression PDF en lot, ou batch compression, est la solution à ce problème : elle permet d'appliquer automatiquement la même réduction de taille à un ensemble de fichiers en une seule commande ou opération. Cette approche est particulièrement utile pour les entreprises qui gèrent de gros volumes de documents scannés, pour les archivistes qui doivent réduire la taille d'une bibliothèque numérique, ou pour tout professionnel qui accumule des PDF au fil du temps. Dans ce guide, nous allons explorer plusieurs méthodes pour compresser des PDF en lot : Ghostscript en ligne de commande, scripts Python, PDF24 (interface graphique Windows) et des outils en ligne avec traitement multiple.
Méthode 1 : Ghostscript pour compresser des PDF en lot (Windows/Mac/Linux)
Ghostscript est l'outil de compression PDF le plus puissant disponible gratuitement. Il est utilisé par LazyPDF en production sur le serveur. Voici comment l'utiliser pour compresser tous les PDF d'un dossier.
- 1Installez Ghostscript : téléchargez-le depuis ghostscript.com (Windows) ou utilisez `brew install ghostscript` (Mac) ou `apt install ghostscript` (Linux).
- 2Ouvrez un terminal (Invite de commandes sur Windows, Terminal sur Mac/Linux).
- 3Naviguez vers le dossier contenant vos PDF avec la commande `cd /chemin/vers/votre/dossier`.
- 4Sur Mac/Linux, exécutez ce script : `for f in *.pdf; do gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook -dNOPAUSE -dQUIET -dBATCH -sOutputFile="compresse_$f" "$f"; done`
- 5Sur Windows PowerShell : adaptez la commande avec `Get-ChildItem *.pdf | ForEach-Object { gs -sDEVICE=pdfwrite ... }`
- 6Une fois terminé, vous trouverez les fichiers compressés préfixés par 'compresse_' dans le même dossier.
Paramètres de compression Ghostscript : choisir le bon niveau
Ghostscript propose quatre préréglages principaux pour la compression PDF. `/screen` applique une compression maximale optimisée pour l'affichage écran — idéal pour les PDFs destinés uniquement à être lus en ligne, avec des images réduites à 72 DPI. `/ebook` est le préréglage le plus polyvalent — il réduit les images à 150 DPI, ce qui donne un résultat lisible à l'écran et acceptable à l'impression — recommandé pour la grande majorité des cas. `/printer` réduit les images à 300 DPI, préservant une qualité d'impression professionnelle — idéal pour des documents destinés à être imprimés. `/prepress` est le préréglage haute qualité qui préserve les couleurs CMJN et convient aux documents destinés à une impression professionnelle. Pour une compression optimale avec préservation de la qualité, `/ebook` est généralement le meilleur compromis.
Méthode 2 : script Python pour la compression de PDF en lot
Un script Python avec la bibliothèque pikepdf offre une compression PDF en lot flexible et programmable. Installez pikepdf avec `pip install pikepdf`. Créez un script qui parcourt récursivement un dossier, ouvre chaque PDF, applique la compression et sauvegarde dans un sous-dossier 'compressed'. Vous pouvez ajouter des fonctionnalités comme le journal des taux de compression obtenus pour chaque fichier, le traitement parallèle pour accélérer le traitement sur des machines multi-cœurs, ou un filtre par taille pour ne compresser que les fichiers dépassant un certain poids. Cette approche est idéale pour les équipes techniques qui ont besoin d'une automatisation fiable et personnalisable.
Méthode 3 : PDF24 pour la compression en lot sans ligne de commande
Pour les utilisateurs Windows qui préfèrent une interface graphique, PDF24 Creator est une excellente alternative. Ce logiciel gratuit disponible sur pdf24.org propose un mode de traitement en lot accessible à tous. Après installation, ouvrez le gestionnaire de lots de PDF24, ajoutez votre dossier de fichiers PDF, sélectionnez l'action 'Compresser', choisissez le niveau de compression souhaité et lancez le traitement. PDF24 traite les fichiers séquentiellement et vous indique la progression en temps réel. Pour chaque fichier, il affiche le taux de réduction obtenu. L'outil respecte la structure de vos dossiers et peut sauvegarder les fichiers compressés dans un dossier de destination séparé.
Questions fréquentes
Combien de temps prend la compression de 100 PDF en lot ?
Cela dépend de la taille des fichiers et de la méthode utilisée. Avec Ghostscript sur un ordinateur moderne, compresser 100 PDF de 5 Mo chacun prend généralement entre 5 et 15 minutes. Avec un script Python en mode parallèle utilisant plusieurs cœurs de processeur, ce temps peut être divisé par 2 à 4. Les fichiers scannés avec beaucoup d'images prennent plus de temps que les PDF principalement textuels.
Puis-je compresser des PDF en lot gratuitement sans logiciel ?
Pour des volumes modérés, un outil en ligne comme LazyPDF permet de compresser plusieurs PDF en traitant les fichiers successivement. Pour de vrais gros volumes (des centaines de fichiers), une solution locale comme Ghostscript ou PDF24 est plus efficace. Ghostscript est entièrement gratuit et open source, et PDF24 est également gratuit pour un usage personnel.
La compression en lot préserve-t-elle les métadonnées et les signets ?
Ghostscript préserve la plupart des métadonnées (titre, auteur, date) et les signets (bookmarks) lors de la compression. Certains paramètres avancés peuvent affecter les métadonnées. Si la préservation exacte des métadonnées est importante, vérifiez les résultats sur un échantillon de fichiers avant de lancer un traitement en lot complet.
Peut-on automatiser la compression quotidienne d'un dossier de PDF ?
Oui, en combinant un script de compression (Ghostscript ou Python) avec un planificateur de tâches. Sur Windows, utilisez le Planificateur de tâches pour exécuter votre script chaque jour à une heure définie. Sur Mac et Linux, utilisez cron ou launchd. Cette configuration permet une compression automatique régulière sans intervention manuelle, idéale pour les services qui reçoivent quotidiennement des PDF à archiver.