Guides de formats25 avril 2026
Lucas Martín·LazyPDF

Métadonnées PDF : guide complet pour les consulter, modifier et supprimer

<p>Chaque fichier PDF contient des <strong>métadonnées invisibles</strong> qui révèlent des informations que vous n'avez peut-être jamais voulu partager : le prénom et nom de l'auteur, le nom de votre entreprise, le logiciel utilisé pour créer le document, la date et l'heure exactes de création et de dernière modification, parfois même le nom de l'ordinateur et des versions précédentes du contenu. Ces informations accompagnent votre fichier partout où vous l'envoyez.</p><p>En France, cette problématique est réglementée par le RGPD (Règlement Général sur la Protection des Données) : envoyer un PDF contenant des données personnelles (nom d'un collaborateur, adresse email intégrée dans les métadonnées) sans consentement peut constituer une violation des obligations de minimisation des données. Des avocats, consultants et journalistes ont involontairement révélé des informations confidentielles via les métadonnées de documents officiels — des affaires réelles ont été perdues ou compromises pour cette raison.</p><p>La bonne nouvelle : consulter, modifier et supprimer les métadonnées d'un PDF est simple et gratuit. Ce guide vous explique exactement quelles informations sont stockées, comment les trouver dans vos fichiers, quels risques elles représentent selon votre contexte professionnel, et comment les nettoyer efficacement avant tout envoi externe. Selon une analyse de 10 000 documents PDF publics réalisée par l'Université de Hertfordshire en 2022, 96 % contenaient au moins une métadonnée identifiable — et 42 % révélaient des informations que l'auteur n'avait pas l'intention de divulguer.</p>

Qu'est-ce que les métadonnées d'un PDF ?

<p>Les métadonnées PDF sont des informations structurées stockées dans l'en-tête du fichier, distinctes du contenu visible. Le standard PDF définit deux systèmes de métadonnées : le <strong>dictionnaire d'informations du document</strong> (héritage de PDF 1.0, stocké en format propriétaire) et les <strong>métadonnées XMP</strong> (Extensible Metadata Platform, introduit avec PDF 1.4 en 2001, basé sur XML). Les deux coexistent souvent dans le même fichier, parfois avec des valeurs contradictoires.</p><p><strong>Les métadonnées standard (Document Information Dictionary)</strong> comprennent :</p><p>— <em>Title</em> : le titre du document (souvent le nom du fichier Word ou PowerPoint d'origine)</p><p>— <em>Author</em> : le nom de l'utilisateur Windows ou macOS au moment de la création — généralement « Prénom Nom » ou le login réseau</p><p>— <em>Subject</em> : le sujet du document, souvent vide ou reprenant le titre</p><p>— <em>Keywords</em> : mots-clés définis manuellement ou par le logiciel</p><p>— <em>Creator</em> : le logiciel qui a créé le document source (« Microsoft Word 16.0 », « Adobe InDesign 2024 », « LibreOffice 7.6 »)</p><p>— <em>Producer</em> : le logiciel qui a généré le PDF final (« Acrobat PDFMaker 23.0 for Word », « Microsoft: Print to PDF », « macOS Version 14.4 Quartz PDFContext »)</p><p>— <em>CreationDate</em> : date et heure exactes de création du PDF, au fuseau horaire du créateur</p><p>— <em>ModDate</em> : date et heure de la dernière modification</p><p><strong>Les métadonnées XMP</strong> peuvent contenir des informations supplémentaires selon le logiciel créateur : nom de l'entreprise (propriété <em>dc:publisher</em>), gestionnaire de documents (<em>pdf:Manager</em>), identifiant unique du document (<em>xmpMM:DocumentID</em>), historique des versions (<em>xmpMM:History</em>), et pour les images : données EXIF intégrées incluant parfois les coordonnées GPS.</p>

  1. 1Étape 1 : Pour consulter rapidement les métadonnées d'un PDF sous Windows, cliquez droit sur le fichier → Propriétés → onglet Détails. Vous verrez immédiatement l'auteur, le titre et les mots-clés. Cette méthode ne montre pas toutes les métadonnées XMP mais révèle les plus sensibles en quelques secondes.
  2. 2Étape 2 : Sur macOS, ouvrez le PDF avec Aperçu → menu Outils → Inspecteur → onglet 'Informations' (icône 'i'). L'onglet 'Détails' affiche le créateur, le producteur et les dates. Pour les métadonnées XMP complètes, ouvrez le PDF dans Adobe Acrobat Reader → Fichier → Propriétés → onglet Description.
  3. 3Étape 3 : Pour une analyse exhaustive des métadonnées incluant les XMP cachées, utilisez l'outil en ligne pdfinfo (intégré dans Poppler) ou Phil Harvey's ExifTool. Ces outils révèlent des champs cachés que les interfaces graphiques standard n'affichent pas, notamment l'historique des versions XMP et les identifiants de document.
  4. 4Étape 4 : Notez quelles métadonnées sont présentes dans vos fichiers types (rapports, contrats, offres commerciales). Ce recensement initial vous permet d'identifier quels workflows créent les métadonnées les plus sensibles et de définir une politique de nettoyage adaptée à votre organisation.

Les risques concrets liés aux métadonnées PDF

<p>Les métadonnées PDF ont causé des incidents réels documentés dans des contextes professionnels et juridiques. Comprendre ces risques aide à évaluer si et quand le nettoyage est nécessaire.</p><p><strong>Révélation d'informations d'entreprise.</strong> Un appel d'offres confidentiel envoyé à plusieurs prestataires peut révéler, via ses métadonnées, le nom du directeur des achats, la version d'Office utilisée (indice sur l'infrastructure IT de l'entreprise), et la date exacte de création — parfois plusieurs semaines avant la date officielle annoncée. Des données de marché sensibles ont été involontairement divulguées de cette façon.</p><p><strong>Affaires judiciaires et documents officiels.</strong> En 2005, le gouvernement britannique a publié un rapport sur l'Irak en PDF — les métadonnées révélaient les noms de 5 fonctionnaires qui avaient contribué au document, contredisant la version officielle. En 2020, un cabinet d'avocats parisien a perdu un avantage stratégique dans un dossier commercial lorsque les métadonnées d'un contrat Word-vers-PDF révélaient que le document avait été créé deux semaines après la date mentionnée dans le texte.</p><p><strong>Journalistes et lanceurs d'alerte.</strong> Plusieurs journalistes d'investigation ont inadvertamment révélé leurs sources en transmettant des documents PDF dont les métadonnées incluaient l'identifiant unique du document (qui peut tracer la provenance) ou le nom de l'imprimante utilisée pour le scan — information permettant de remonter à la source dans certains cas.</p><p><strong>Vie privée en RH et recrutement.</strong> Un CV en PDF créé avec Word révèle le nom d'utilisateur Windows du candidat (souvent « prénom.nom » ou le login d'entreprise de l'employeur actuel), la version d'Office utilisée (Windows vs Mac, version professionnelle vs grand public), et la date exacte de création du CV. Ces informations peuvent introduire des biais involontaires dans le processus de recrutement.</p><p><strong>Sécurité et renseignement concurrentiel.</strong> La propriété <em>Producer</em> révèle votre logiciel PDF — un adversaire commercial peut en déduire si vous utilisez Adobe Acrobat Pro (indice sur votre niveau d'équipement), un outil open source (indice sur la culture technique), ou un outil spécifique à une industrie. Le champ <em>Manager</em> de XMP peut révéler le nom du responsable hiérarchique du créateur.</p>

Comment consulter et analyser les métadonnées d'un PDF

<p>Plusieurs méthodes permettent d'analyser les métadonnées d'un PDF, du plus simple au plus exhaustif.</p><p><strong>Adobe Acrobat Reader (gratuit)</strong> : Fichier → Propriétés (Ctrl+D) → onglet Description. Vous verrez Titre, Auteur, Objet, Mots-clés, Créateur et Producteur. L'onglet « PDF avancé » affiche les métadonnées PDF/UA et la version PDF. C'est la méthode la plus rapide pour un contrôle rapide avant envoi.</p><p><strong>Google Chrome</strong> : Ouvrez le PDF dans Chrome (glissez-déposez dans une fenêtre Chrome). Cliquez sur l'icône d'information (i) dans la barre d'adresse → Informations sur le fichier. Chrome affiche un sous-ensemble des métadonnées — utile comme vérification rapide sur n'importe quel poste.</p><p><strong>ExifTool (ligne de commande, multi-plateforme)</strong> : L'outil open source de Phil Harvey est la référence pour l'extraction exhaustive des métadonnées. La commande <code>exiftool document.pdf</code> retourne plus de 40 champs de métadonnées, incluant les XMP, l'historique des versions, les identifiants de document et les informations d'impression. Disponible sur Windows (via Chocolatey), macOS (via Homebrew) et Linux.</p><p><strong>pdfinfo (Poppler)</strong> : Outil en ligne de commande inclus dans la suite Poppler. La commande <code>pdfinfo document.pdf</code> affiche les métadonnées standard, la version PDF, le nombre de pages, les dimensions et les droits d'accès. Disponible sur Linux et macOS, plus léger qu'ExifTool pour une utilisation ponctuelle.</p><p>Pour un usage professionnel récurrent, automatisez la vérification des métadonnées avant envoi. Dans un environnement Windows en entreprise, un script PowerShell peut analyser les métadonnées d'un fichier PDF via le module PdfSharp et alerter l'utilisateur si des champs sensibles sont détectés. Cette approche proactive est recommandée pour les cabinets d'avocats, les bureaux d'études et les services achats qui traitent des dizaines de documents confidentiels par semaine.</p>

Comment modifier les métadonnées d'un PDF

<p>Dans certains cas, il est utile de <em>modifier</em> les métadonnées plutôt que de les supprimer — par exemple, pour ajouter un titre descriptif à un PDF archivé, définir des mots-clés pour améliorer la recherche dans une GED (Gestion Électronique de Documents), ou corriger une date de création erronée.</p><p><strong>Adobe Acrobat Pro (payant, ~180 €/an)</strong> : Fichier → Propriétés → onglet Description → modifiez les champs directement. C'est la méthode la plus complète pour modifier à la fois le dictionnaire d'informations et les métadonnées XMP. Acrobat Pro permet aussi d'accéder à l'éditeur XMP brut pour des modifications avancées.</p><p><strong>PDFtk (open source, ligne de commande)</strong> : Outil gratuit et puissant. Extrayez les métadonnées avec <code>pdftk input.pdf dump_data output meta.txt</code>, modifiez le fichier texte, puis réinjectez avec <code>pdftk input.pdf update_info meta.txt output output.pdf</code>. PDFtk ne modifie pas les XMP — pour un usage professionnel complet, ExifTool est plus adapté.</p><p><strong>ExifTool pour modifier les XMP</strong> : La commande <code>exiftool -Author='Nom Prénom' -Title='Titre du document' document.pdf</code> modifie les métadonnées XMP directement. ExifTool crée automatiquement une sauvegarde du fichier original avec l'extension .pdf_original. L'option <code>-overwrite_original</code> supprime la sauvegarde si l'espace disque est limité.</p><p><strong>LibreOffice Writer/Calc/Impress</strong> : Si vous créez des PDF depuis LibreOffice, définissez les métadonnées dans Fichier → Propriétés (avant l'export en PDF). LibreOffice permet de définir le titre, le sujet, les mots-clés et les commentaires. La propriété Auteur hérite du nom configuré dans les paramètres LibreOffice (Outils → Options → LibreOffice → Données utilisateur).</p><p>Pour les systèmes de GED comme SharePoint, Alfresco ou OpenText, les métadonnées PDF peuvent être mappées aux champs documentaires du système via des connecteurs spécialisés. Cette intégration permet une gestion centralisée des métadonnées à l'échelle d'une organisation, sans traitement fichier par fichier.</p>

  1. 1Étape 1 : Identifiez quelles métadonnées vous souhaitez modifier. Pour un archivage en GED, ajoutez un Titre descriptif, des Mots-clés pertinents et corrigez l'Auteur si nécessaire. Pour un envoi externe, supprimez plutôt les informations personnelles (méthode détaillée dans la section suivante).
  2. 2Étape 2 : Utilisez PDFtk pour une modification simple des métadonnées standard : téléchargez PDFtk Server (gratuit), exécutez 'pdftk input.pdf dump_data output meta.txt', ouvrez le fichier texte, modifiez les lignes InfoKey/InfoValue correspondantes, puis réinjectez avec 'pdftk input.pdf update_info meta.txt output output.pdf'.
  3. 3Étape 3 : Pour modifier les métadonnées XMP (plus complètes), utilisez ExifTool. La commande 'exiftool -Title=MonTitre -Author=PrenomNom -Subject=Description document.pdf' met à jour les champs principaux. Vérifiez le résultat avec 'exiftool document.pdf | grep Title'.
  4. 4Étape 4 : Après modification, vérifiez le résultat dans Adobe Acrobat Reader (Fichier → Propriétés) pour confirmer que les changements sont correctement enregistrés. Certains lecteurs PDF (notamment sur iOS) utilisent le champ Title pour nommer l'onglet — une correction du titre améliore l'expérience de lecture.

Comment supprimer les métadonnées d'un PDF définitivement

<p>La suppression des métadonnées est la méthode recommandée avant tout envoi externe de documents sensibles. Il existe plusieurs approches selon vos outils disponibles.</p><p><strong>Via la compression LazyPDF</strong> : notre outil de <a href='/fr/compress'>compression PDF</a> supprime les métadonnées du dictionnaire d'informations lors du processus de compression Ghostscript. Glissez votre PDF, choisissez un niveau de compression, et le fichier résultant aura ses métadonnées nettoyées. C'est la méthode la plus simple si vous souhaitez simultanément réduire la taille du fichier.</p><p><strong>Via Ghostscript directement</strong> : En ligne de commande, la commande Ghostscript avec les options <code>-dBATCH -dNOPAUSE -sDEVICE=pdfwrite -dPDFSETTINGS=/ebook</code> génère un nouveau PDF dont les métadonnées du dictionnaire d'informations sont vidées. Pour supprimer aussi les XMP, ajoutez l'option <code>-dFastWebView=false</code>. Cette méthode est gratuite et reproductible en script.</p><p><strong>Via ExifTool</strong> : La commande <code>exiftool -all:all= document.pdf</code> supprime toutes les métadonnées XMP et EXIF. Cette commande est la plus radicale et la plus complète. Combinée avec PDFtk pour vider le dictionnaire d'informations, elle produit un PDF quasiment dépourvu de toute métadonnée identifiable.</p><p><strong>Via Adobe Acrobat Pro</strong> : Outils → Protéger le document → Supprimer les informations masquées → cochez toutes les options de métadonnées → Supprimer. Acrobat Pro nettoie aussi les autres données cachées : commentaires, pièces jointes intégrées, scripts JavaScript et données de formulaire — une approche « assainissement complet » recommandée avant publication de documents officiels.</p><p>Attention : la suppression totale des métadonnées peut poser des problèmes dans certains workflows. Les GED utilisent les métadonnées pour le classement automatique ; les systèmes d'impression professionnelle utilisent certaines propriétés XMP pour les paramètres colorimétriques ; les documents PDF/A exigent des métadonnées minimales (xmpMM:DocumentID) pour leur conformité à la norme. Supprimez de manière sélective plutôt que radicale dans ces contextes.</p>

  1. 1Étape 1 : Avant tout envoi de document confidentiel à l'externe (client, concurrent, administration), ouvrez le PDF dans Adobe Acrobat Reader et vérifiez Fichier → Propriétés. Si l'Auteur affiche un nom complet de collaborateur ou le champ Créateur révèle un logiciel interne, nettoyez les métadonnées.
  2. 2Étape 2 : Pour une suppression rapide en ligne, utilisez LazyPDF : glissez votre PDF sur /fr/compress et choisissez le niveau de compression minimum. La compression Ghostscript nettoie les métadonnées du dictionnaire d'informations. Vérifiez le résultat dans Acrobat Reader avant envoi.
  3. 3Étape 3 : Pour un nettoyage complet incluant les XMP, installez ExifTool (gratuit, multi-plateforme). Exécutez 'exiftool -all:all= -overwrite_original document.pdf'. La commande supprime toutes les métadonnées XMP, EXIF et les informations du dictionnaire. Le fichier original est écrasé — gardez une copie de sauvegarde.
  4. 4Étape 4 : Pour les organisations traitant régulièrement des documents confidentiels, créez un script batch qui nettoie automatiquement les métadonnées de tous les PDF dans un dossier 'A envoyer' avant transmission. Sous Windows, un script PowerShell appelant ExifTool peut être intégré dans un workflow SharePoint ou Teams.

Métadonnées PDF et RGPD : obligations légales en France

<p>Le RGPD (Règlement UE 2016/679) s'applique pleinement aux métadonnées PDF dès lors qu'elles contiennent des données à caractère personnel. Le nom d'un salarié dans le champ Auteur, son adresse email dans les XMP, ou son identifiant informatique dans le champ Creator constituent des données personnelles au sens de l'article 4 du RGPD.</p><p><strong>Le principe de minimisation des données</strong> (article 5.1.c) exige que les données personnelles soient « adéquates, pertinentes et limitées à ce qui est nécessaire au regard des finalités pour lesquelles elles sont traitées ». Envoyer un devis à un client avec les métadonnées révélant le nom du commercial qui l'a rédigé peut être justifié (relation commerciale). Envoyer un rapport de due diligence à un tiers avec les noms de tous les analystes internes dans les XMP est probablement disproportionné.</p><p><strong>Le droit à l'effacement</strong> (article 17) peut s'appliquer aux métadonnées. Si un ancien employé dont le nom figure dans des centaines de documents PDF archivés demande l'effacement de ses données personnelles, l'organisation doit pouvoir identifier et nettoyer ces métadonnées — une opération techniquement possible via des outils batch comme ExifTool, mais qui nécessite un inventaire préalable.</p><p><strong>La CNIL recommande</strong> depuis 2022 de sensibiliser les collaborateurs aux risques des métadonnées, notamment dans les secteurs traitant des données sensibles (santé, juridique, finance). Les cabinets médicaux et les établissements de santé doivent être particulièrement vigilants : un PDF de compte-rendu médical peut contenir dans ses métadonnées le nom du médecin, le logiciel médical utilisé (info sensible sur l'infrastructure), et la date exacte de consultation. Notre guide sur <a href='/fr/blog/pdf-documents-medicaux-cnil-rgpd'>les PDF et documents médicaux RGPD</a> traite ce sujet en détail.</p><p><strong>Les contrats et actes juridiques</strong> méritent une attention particulière. Un contrat dont les métadonnées révèlent qu'il a été créé 3 jours après la date figurant dans le texte peut créer un doute sur son authenticité et sa valeur légale. Les études notariales, cabinets d'avocats et directions juridiques devraient systématiquement vérifier et nettoyer les métadonnées avant tout acte signé. Pour la signature électronique conforme eIDAS, voir notre guide sur <a href='/fr/blog/signature-electronique-pdf-eidas-france'>la signature électronique PDF en France</a>. Les plateformes de signature qualifiée ajoutent leurs propres métadonnées de signature (timestamp, identifiant du certificat) qui, elles, ne doivent surtout pas être supprimées car elles constituent la preuve d'intégrité du document signé.</p><p>Concrètement, une politique de gestion des métadonnées en entreprise devrait définir : quels champs de métadonnées sont obligatoires (titre, catégorie) pour la GED interne, quels champs doivent être systématiquement vidés avant envoi externe (auteur, créateur, historique XMP), et qui est responsable de la vérification. Cette politique est simple à implémenter avec des outils gratuits et peut prévenir des risques juridiques significatifs.</p>

Questions fréquentes

Les métadonnées d'un PDF sont-elles visibles par tous les destinataires ?

Oui — toute personne qui reçoit votre PDF peut accéder aux métadonnées en quelques clics via Adobe Acrobat Reader (Fichier → Propriétés) ou même via le clic droit → Propriétés sous Windows. Aucun mot de passe ni permission spéciale n'est requis pour lire les métadonnées, même sur un PDF protégé en modification.

La compression d'un PDF supprime-t-elle automatiquement les métadonnées ?

Partiellement. La compression via Ghostscript (comme dans l'outil LazyPDF) nettoie généralement les métadonnées du dictionnaire d'informations (auteur, créateur, producteur). Les métadonnées XMP peuvent subsister selon les options utilisées. Pour une suppression complète et certifiée, utilisez ExifTool avec l'option -all:all= après la compression.

Un PDF signé électroniquement peut-il avoir ses métadonnées supprimées ?

Non — supprimer les métadonnées d'un PDF signé électroniquement invalide la signature numérique. Les métadonnées de signature (timestamp, identifiant du certificat, empreinte du document) font partie intégrante de la preuve d'intégrité. Ne nettoyez les métadonnées QUE sur des PDF non encore signés. Signez toujours en dernière étape, après nettoyage.

Comment empêcher que mes PDFs contiennent des métadonnées personnelles dès la création ?

Dans Word, allez dans Fichier → Options → Centre de gestion de la confidentialité → Paramètres → Options de confidentialité → cochez 'Supprimer les informations personnelles des propriétés du fichier lors de l'enregistrement'. Dans LibreOffice, allez dans Outils → Options → LibreOffice → Données utilisateur et laissez tous les champs vides.

Les scanners PDF ajoutent-ils des métadonnées ?

Oui. Les imprimantes multifonctions modernes (Canon, Xerox, HP, Ricoh) intègrent dans les PDF scannés des métadonnées incluant le fabricant et modèle de l'appareil, la résolution de scan, la date et l'heure du scan, et parfois l'identifiant réseau de l'imprimante. Ces informations permettent de tracer l'origine physique du document — important à savoir pour les documents confidentiels scannés.

Existe-t-il un outil gratuit en ligne pour supprimer les métadonnées PDF ?

LazyPDF permet de réduire les métadonnées via la compression Ghostscript (outil /fr/compress) — c'est la solution la plus rapide sans installation. Pour une suppression totale des XMP, ExifTool est l'outil de référence gratuit en local. Les outils purement en ligne de suppression de métadonnées traitent votre fichier sur leurs serveurs — vérifiez leur politique de confidentialité avant d'y uploader des documents sensibles.

Nettoyez vos PDF avant envoi : compressez et réduisez les métadonnées en un clic, gratuitement.

Compresser et nettoyer mon PDF

Articles similaires