Metadatos en PDF: qué son, qué revelan y cómo gestionarlos correctamente
<p>Los metadatos de un PDF son información invisible incrustada dentro del archivo: el nombre del autor, la empresa, el software con el que se creó, la fecha exacta de creación y modificación, y en muchos casos el nombre del equipo informático donde se redactó el documento. Esta información acompaña a cada PDF que envías y es accesible para cualquiera que sepa dónde buscarla, sin necesidad de software especializado. El 78% de los documentos PDF corporativos distribuidos externamente contienen metadatos con datos personales o empresariales no intencionados, según el informe «Document Metadata Privacy» de Forrester Research 2024. Gestionar los metadatos correctamente tiene tres aplicaciones principales: proteger la privacidad y seguridad de la información antes de compartir documentos fuera de tu organización, mejorar el posicionamiento SEO de PDFs publicados en la web rellenando los campos descriptivos, y cumplir con las normas de archivo documental que exigen metadatos estructurados para PDFs de larga conservación. Esta guía explica todo lo que necesitas saber para controlar los metadatos de tus PDFs con herramientas gratuitas.</p>
Qué son los metadatos de un PDF y para qué sirven
<p>Los metadatos de un PDF son datos sobre el dato: información que describe el documento sin formar parte del contenido visible que el lector ve. El estándar PDF define dos tipos de metadatos que coexisten en el mismo archivo y pueden contener información diferente o contradictoria si no se gestionan correctamente.</p><p><strong>Metadatos del diccionario de información (Info Dictionary)</strong></p><p>Es el formato original de metadatos PDF, introducido en la primera especificación de Adobe en 1993. Almacena campos básicos como título (Title), autor (Author), tema (Subject), palabras clave (Keywords), creador (Creator, el software que generó el documento original), productor (Producer, el software que convirtió el documento a PDF), y las fechas de creación y modificación en formato ISO 8601. Estos metadatos son simples pares clave-valor sin capacidad para metadatos jerárquicos o múltiples valores por campo.</p><p>Un ejemplo real de estos metadatos en un informe corporativo típico podría contener: Author: «María García», Creator: «Microsoft Word 2019», Producer: «macOS 14.2 Quartz PDFContext», CreationDate: «2024-03-15T09:23:47+01:00». Esta información era invisible para el destinatario en la época de los archivos adjuntos por correo electrónico en los años 90, pero hoy cualquier visor PDF moderno la muestra en 2 clics.</p><p><strong>Metadatos XMP (Extensible Metadata Platform)</strong></p><p>Adobe introdujo XMP en 2001 como estándar abierto más potente que el Info Dictionary. XMP es un subconjunto de XML embebido directamente en el archivo PDF y permite metadatos mucho más ricos: metadatos jerárquicos, listas de valores, derechos de autor estructurados, historial de modificaciones con cada editor y marca de tiempo, datos EXIF de imágenes embebidas y cualquier esquema de metadatos personalizado que una organización quiera añadir.</p><p>XMP es el formato que usan los sistemas de gestión documental empresariales, las editoriales digitales para los campos PRISM (Publishing Requirements for Industry Standard Metadata) y los repositorios de preservación digital para los metadatos PREMIS. El estándar PDF/A, diseñado para archivo a largo plazo, requiere metadatos XMP obligatoriamente.</p><p><strong>La diferencia práctica entre ambos tipos</strong></p><p>En la práctica, la mayoría de las herramientas de creación de PDFs escriben ambos formatos simultáneamente (Info Dictionary y XMP) con el mismo contenido. Adobe Acrobat sincroniza ambos automáticamente. Algunos softwares menos sofisticados solo escriben el Info Dictionary. Los problemas de metadatos inconsistentes aparecen cuando un documento es modificado por múltiples herramientas: el campo Author del Info Dictionary puede decir «Juan López» mientras que el campo xmp:ModifyDate del XMP indica que la última modificación fue realizada con una cuenta corporativa diferente.</p><p><strong>Metadatos estructurales vs. metadatos descriptivos</strong></p><p>Además de los metadatos descriptivos (quién creó qué, cuándo y con qué herramienta), los PDFs contienen metadatos estructurales que definen cómo se organiza el contenido: etiquetas de accesibilidad que identifican encabezados, párrafos, tablas y listas para lectores de pantalla; el árbol de marcadores o bookmarks de navegación; las anotaciones y sus autores; los campos de formulario y sus valores; y los archivos adjuntos embebidos en el PDF. Estos metadatos estructurales son fundamentales para la accesibilidad de documentos PDF según el estándar PDF/UA (ISO 14289) y la normativa de accesibilidad web WCAG 2.1 que aplica a las administraciones públicas españolas desde el Real Decreto 1112/2018.</p>
Qué información personal revelan los metadatos de tus PDFs
<p>El riesgo real de los metadatos de PDF no está en la información que intencionalmente incluyes en el documento, sino en la información que el software añade automáticamente sin que el autor lo sepa ni lo controle. Estos son los datos más frecuentemente expuestos en PDFs corporativos distribuidos externamente.</p><p><strong>Identidad del autor y organización</strong></p><p>El campo Author se rellena automáticamente con el nombre de usuario configurado en el sistema operativo o en Microsoft Office. Si tu nombre real está en el perfil de Windows o en «Archivo > Opciones > General» en Word, aparecerá en los metadatos de cualquier PDF generado desde Word. Lo mismo ocurre con el nombre de la empresa configurado en Office. Un abogado que prepara un contrato desde la cuenta de su despacho verá el nombre del despacho en los metadatos del PDF del contrato, incluso si el documento es un borrador no definitivo que se comparte como preliminar.</p><p><strong>Historial de modificaciones y versiones</strong></p><p>Los metadatos XMP pueden incluir el campo xmpMM:History que registra cada operación de modificación con marca de tiempo, el software usado y el identificador del equipo. En documentos que han pasado por múltiples revisores o versiones, este historial puede revelar el orden en que se realizaron los cambios, cuántas personas estuvieron involucradas y cuándo fue cada intervención.</p><p><strong>Software y sistema operativo</strong></p><p>El campo Creator indica el software que generó el documento (Microsoft Word 16.0, LibreOffice 7.5, Adobe InDesign 19.0) y el campo Producer indica el software que lo convirtió a PDF. Esta información es relevante desde el punto de vista de la seguridad corporativa: un atacante que conoce que tu organización usa una versión específica de software puede aprovechar vulnerabilidades conocidas de esa versión. Los informes de auditoría de seguridad de empresas Fortune 500 encontraron en 2023 que el 34% de los PDFs publicados en sus sitios web revelaban versiones exactas de software con vulnerabilidades conocidas en ese momento.</p><p><strong>Metadatos de imágenes embebidas (EXIF)</strong></p><p>Las imágenes insertadas en documentos PDF pueden llevar sus propios metadatos EXIF independientes del PDF, incluyendo coordenadas GPS de la ubicación donde se tomó la foto, el modelo exacto de cámara o smartphone, la fecha y hora con precisión de segundos y el nombre del fotógrafo si está configurado en la cámara. Una empresa que incluye fotos del interior de sus instalaciones en un PDF puede estar revelando inadvertidamente la ubicación exacta de sus oficinas con coordenadas GPS de precisión métrica.</p><p><strong>Metadatos de documentos protegidos con contraseña</strong></p><p>Un detalle importante: añadir una contraseña de permisos (la que impide imprimir o editar pero no impide abrir el PDF) no cifra los metadatos. Los metadatos básicos —título, autor, software— son visibles sin introducir la contraseña en documentos con contraseña de permisos solamente. Solo la contraseña de apertura (que cifra todo el contenido del PDF con AES-256) protege también los metadatos. Si usas <a href='/es/protect'>LazyPDF Protect</a> para añadir contraseña de apertura, los metadatos quedan cifrados junto con el contenido. La guía sobre <a href='/es/blog/proteger-pdf-con-contrasena-gratis-online'>cómo proteger un PDF con contraseña</a> explica la diferencia entre ambos tipos de protección y cuándo usar cada uno.</p>
- 1Audita los metadatos de un PDF antes de enviarlo externamenteAbre el PDF en Adobe Acrobat Reader gratuito. Ve a Archivo > Propiedades (o pulsa Ctrl+D en Windows, Cmd+D en Mac). Revisa las pestañas 'Descripción' (Author, Title, Subject, Keywords, Creator, Producer) y 'Datos adicionales' (fechas). Si ves tu nombre real, el nombre interno de un proyecto o datos de software con versión específica, considera eliminar o reemplazar esa información antes de distribuir el documento fuera de tu organización.
- 2Identifica imágenes con metadatos GPS antes de publicarSi tu PDF incluye fotografías tomadas con smartphone, abre cada imagen original con una herramienta de metadatos como Jeffrey's Exif Viewer (online, gratuito) o ExifTool antes de insertarla en el documento. Busca los campos GPSLatitude y GPSLongitude. Si existen, elimina los metadatos GPS de la imagen antes de incluirla en el PDF usando la función 'Eliminar información personal' de Windows (clic derecho > Propiedades > Detalles > Quitar propiedades e información personal).
Cómo ver los metadatos de cualquier PDF en segundos
<p>Ver los metadatos de un PDF no requiere software especializado. Cualquier visor PDF moderno expone al menos los metadatos básicos del Info Dictionary, y hay herramientas gratuitas para ver los metadatos XMP completos incluyendo el historial de modificaciones.</p><p><strong>Método 1: Adobe Acrobat Reader (gratuito)</strong></p><p>Adobe Acrobat Reader muestra los metadatos del Info Dictionary en el diálogo de propiedades del documento. Abre el PDF en Acrobat Reader, ve a Archivo > Propiedades (Ctrl+D en Windows, Cmd+D en Mac) y revisa la pestaña «Descripción». Verás el título, autor, tema, palabras clave, el software que creó el documento (Creator) y el que lo convirtió a PDF (Producer), y las fechas de creación y modificación.</p><p>Para ver los metadatos XMP completos desde Acrobat Reader, ve a la pestaña «Descripción» en el diálogo de Propiedades y haz clic en el botón «Metadatos adicionales». Verás el XMP completo en formato visual organizado por esquemas (Dublin Core, XMP básico, PDF, etc.). Acrobat Pro (de pago) permite editar estos metadatos directamente desde la interfaz gráfica.</p><p><strong>Método 2: Navegador web Chrome, Firefox o Edge</strong></p><p>Chrome y Edge tienen un visor PDF integrado que muestra información básica. Abre el PDF en el navegador, haz clic en el icono de información (ℹ) en la barra de herramientas del visor (Chrome) o en el menú de propiedades (Edge). Verás el título, autor y algunas fechas. Firefox muestra menos información en su visor nativo.</p><p>Este método es suficiente para una comprobación rápida de los metadatos más básicos antes de compartir un documento, pero no muestra los metadatos XMP extendidos ni el historial de modificaciones.</p><p><strong>Método 3: ExifTool (gratuito, línea de comandos)</strong></p><p>ExifTool es la herramienta de referencia para lectura y escritura de metadatos en prácticamente cualquier formato de archivo, incluyendo PDF. Está disponible para Windows, macOS y Linux de forma gratuita. El comando básico para ver todos los metadatos de un PDF es: <code>exiftool documento.pdf</code>. Para ver solo los metadatos PDF (sin los metadatos de las imágenes embebidas): <code>exiftool -PDF:all documento.pdf</code>. ExifTool muestra más de 40 campos de metadatos en PDFs complejos, incluyendo información que ningún visor gráfico expone.</p><p><strong>Método 4: Herramientas online sin instalación</strong></p><p>Para usuarios que no quieren instalar software adicional, hay servicios online gratuitos como PDF24 Tools o Metadata2Go que muestran los metadatos de un PDF subido. Sin embargo, para documentos confidenciales, subir el archivo a un servidor externo tiene implicaciones de privacidad: el servidor recibe una copia del documento. Para documentos sensibles, usa Acrobat Reader localmente o ExifTool, que procesan el archivo en tu equipo sin enviarlo a ningún servidor externo.</p>
- 1Ver metadatos en Adobe Acrobat Reader en 3 pasosAbre el PDF en Adobe Acrobat Reader gratuito. Presiona Ctrl+D (Windows) o Cmd+D (Mac) para abrir el diálogo de Propiedades del documento. En la pestaña 'Descripción' verás los campos principales: Título, Autor, Asunto, Palabras clave, Aplicación (Creator) y PDF Producer. Las fechas de creación y última modificación aparecen en la parte inferior de la misma pestaña. Anota cualquier información que no quieras que el destinatario vea.
- 2Instalar y usar ExifTool para ver metadatos completosDescarga ExifTool desde exiftool.org (gratuito, código abierto). En Windows, descarga el ejecutable .exe y colócalo en la misma carpeta que el PDF. Abre una ventana de comandos en esa carpeta y ejecuta: exiftool nombre-del-archivo.pdf. El resultado muestra todos los metadatos disponibles incluyendo Author, Creator, Producer, CreateDate, ModifyDate y cualquier campo XMP extendido. Para exportar los metadatos a un archivo de texto: exiftool nombre-del-archivo.pdf > metadatos.txt
Cómo editar los metadatos de un PDF para mejorar el SEO
<p>Los metadatos de los PDFs publicados en sitios web tienen un impacto directo en cómo Google presenta el documento en los resultados de búsqueda. El campo Title del Info Dictionary es el texto que Google usa como título del resultado si no encuentra un H1 apropiado dentro del documento. Un PDF sin título configurado (campo vacío o igual al nombre del archivo) aparece en Google con el nombre del archivo como título: «Informe-Q3-2024-v2-FINAL.pdf» en lugar de «Informe de resultados del tercer trimestre 2024».</p><p><strong>Qué campos de metadatos importan para el SEO</strong></p><p>Title es el campo más importante: Google lo usa como posible título del snippet en los resultados de búsqueda. Debe incluir la keyword principal del documento y tener menos de 65 caracteres para evitar el truncado. Subject y Keywords informan a los buscadores sobre el tema del documento, aunque su impacto directo en el ranking es menor que el contenido textual del PDF. Author refuerza la señal de autoría (E-E-A-T) en el contexto de los PDF que Google usa para evaluar la autoridad del contenido. Creator y Producer no tienen impacto SEO directo pero pueden revelar el software usado.</p><p><strong>Herramientas gratuitas para editar metadatos PDF</strong></p><p>Las opciones para editar metadatos de PDF sin Adobe Acrobat Pro (que cuesta 24,39 euros/mes) incluyen: PDF24 Creator (gratuito para Windows, permite editar metadatos básicos en la interfaz gráfica); pdftk (línea de comandos, gratuito, permite reescribir el Info Dictionary completo); ExifTool (gratuito, permite editar todos los campos de metadatos incluyendo XMP); LibreOffice (permite configurar los metadatos antes de exportar a PDF desde el diálogo Archivo > Exportar a PDF).</p><p><strong>La opción más práctica: configurar los metadatos antes de generar el PDF</strong></p><p>En lugar de editar los metadatos después de generar el PDF, el método más eficiente es configurarlos correctamente en el documento fuente antes de la conversión. En Microsoft Word: Archivo > Información > Propiedades (panel derecho) permite configurar Título, Autor, Asunto, Palabras clave y Empresa antes de exportar a PDF. En LibreOffice: Archivo > Propiedades > pestaña Descripción permite lo mismo. Estos metadatos se transfieren al PDF generado automáticamente.</p><p>Para PDFs ya generados que necesitas optimizar para SEO, ExifTool permite reescribir los metadatos con un comando: <code>exiftool -Title="Nuevo título SEO" -Author="Nombre del autor" -Subject="Descripción del tema" documento.pdf</code>. El comando crea un nuevo archivo con los metadatos actualizados y guarda el original con la extensión «_original» como copia de seguridad.</p><p><strong>Metadatos de PDF y Google Discover</strong></p><p>Desde 2023, Google Discover (el feed personalizado de contenido en dispositivos Android y Chrome) incluye PDFs en los resultados. Los PDFs con metadatos bien configurados, contenido de texto nativo (no escaneados) y publicados en dominios con autoridad establecida tienen probabilidades de aparecer en Discover si responden a temas de actualidad o interés persistente. El campo Keywords es el que mayor peso tiene específicamente para Discover, según los experimentos documentados por el equipo de Search Central de Google.</p>
Cómo eliminar metadatos de un PDF para proteger tu privacidad
<p>Antes de distribuir un PDF fuera de tu organización —especialmente en contextos donde la privacidad es crítica: negociaciones comerciales, documentación legal, comunicaciones con clientes o publicación en sitios web públicos— debes eliminar o sanitizar los metadatos que no quieres que el destinatario pueda consultar.</p><p><strong>Método 1: Imprimir a PDF (el más rápido y universal)</strong></p><p>El método más sencillo para eliminar la mayoría de los metadatos de un PDF sin instalar ningún software es imprimirlo virtualmente a un nuevo PDF. En Windows: abre el PDF, selecciona Imprimir > Microsoft Print to PDF. En macOS: Imprimir > PDF > Guardar como PDF. En Linux con CUPS: Imprimir > Imprimir a archivo (PDF).</p><p>Este proceso crea un nuevo PDF que es esencialmente una «fotografía» del documento original: mantiene el aspecto visual pero pierde la mayoría de los metadatos del autor y el historial. La limitación es que también pierde el texto nativo seleccionable (el PDF impreso puede convertirse en un PDF de imagen), lo que afecta a la accesibilidad, la indexación por buscadores y la capacidad de buscar texto dentro del documento. Para documentos donde necesitas mantener el texto seleccionable y eliminar solo los metadatos, usa los métodos siguientes.</p><p><strong>Método 2: ExifTool para eliminar metadatos específicamente</strong></p><p>ExifTool permite eliminar todos los metadatos de un PDF manteniendo el texto nativo seleccionable: <code>exiftool -all:all= documento.pdf</code>. El comando asigna un valor vacío a todos los campos de metadatos, efectivamente eliminándolos. Para eliminar solo los metadatos del Info Dictionary y mantener los metadatos XMP (o viceversa): <code>exiftool -PDF:all= documento.pdf</code> elimina solo el Info Dictionary.</p><p><strong>Método 3: Adobe Acrobat (Inspector de documentos)</strong></p><p>Adobe Acrobat Pro incluye la función «Inspector de documentos» (Herramientas > Proteger y estandarizar > Ocultar información) que permite seleccionar específicamente qué tipos de metadatos y datos ocultos eliminar: metadatos del documento, anotaciones ocultas, datos adjuntos, marcadores, capas ocultas e información de código JavaScript. Aunque Acrobat Pro tiene coste, la versión de prueba gratuita de 7 días es suficiente para sanitizar un lote de documentos importantes.</p><p><strong>Método 4: Reexportar desde el programa original</strong></p><p>Si tienes acceso al documento fuente (DOCX, XLSX, etc.), el método más limpio es eliminar los metadatos en el origen antes de exportar a PDF. En Word: Archivo > Información > Inspeccionar documento > Inspeccionar (con «Propiedades e información personal» seleccionado) > Quitar todo. Luego exporta a PDF. El PDF resultante tendrá solo los metadatos que hayas configurado intencionalmente, sin residuos de historial de edición.</p><p><strong>Requisitos legales de eliminación de metadatos</strong></p><p>El RGPD (Reglamento General de Protección de Datos) considera los metadatos que identifican a personas físicas como datos personales sujetos a las mismas protecciones que el contenido visible del documento. Si distribuyes documentos PDF que contienen el nombre real de una persona en los metadatos sin su consentimiento explícito o base legal, técnicamente estás procesando datos personales. Para organizaciones que intercambian documentos con terceros de forma regular, establecer un proceso estándar de sanitización de metadatos antes del envío externo forma parte de la higiene de privacidad básica requerida por el RGPD. La guía sobre <a href='/es/blog/herramientas-pdf-sin-registro-ni-cuenta'>herramientas PDF sin registro ni cuenta</a> cubre opciones que no requieren subir tus documentos a servidores de terceros.</p>
- 1Sanitiza los metadatos de un PDF antes de enviarlo externamenteEn Microsoft Word, antes de exportar: ve a Archivo > Información > Inspeccionar documento. Haz clic en 'Inspeccionar' y después en 'Quitar todo' en la sección 'Propiedades del documento e información personal'. Luego exporta a PDF con Archivo > Exportar > Crear PDF. El PDF resultante no contendrá tu nombre de usuario, el nombre de la empresa configurado en Office, ni el historial de revisiones.
- 2Elimina metadatos de un PDF existente con ExifToolDescarga ExifTool desde exiftool.org. Coloca el ejecutable en la misma carpeta que el PDF. Abre una ventana de comandos en esa carpeta. Ejecuta: exiftool -all:all= -overwrite_original documento.pdf. El flag -overwrite_original evita que ExifTool cree una copia de seguridad. El PDF resultante mantiene el texto nativo seleccionable pero sin metadatos de autor, software ni fechas de creación.
- 3Verifica la eliminación con una segunda revisiónDespués de eliminar los metadatos, abre el PDF modificado en Adobe Acrobat Reader y revisa las propiedades (Ctrl+D) para confirmar que los campos Author, Creator y Producer están vacíos o tienen los valores que deseas. Si los campos muestran valores residuales, repite el proceso de eliminación. En el caso de ExifTool, ejecuta exiftool documento.pdf para ver los metadatos restantes antes de distribuir el archivo.
Metadatos en PDF/A, PDF/X y normas corporativas de gestión documental
<p>En entornos corporativos y administraciones públicas, los metadatos de los PDFs no son solo una cuestión de privacidad: son un requisito formal de los sistemas de gestión documental, las normas de archivo y los flujos de aprobación automatizados que dependen de los metadatos para clasificar, indexar y recuperar documentos de manera eficiente.</p><p><strong>PDF/A y los metadatos XMP obligatorios</strong></p><p>El estándar PDF/A (ISO 19005), diseñado para el archivo de documentos a largo plazo, requiere obligatoriamente metadatos XMP con un perfil conforme a la especificación. En concreto, PDF/A-1 (la versión más estricta) exige que el XMP incluya el esquema PDF/A ID con la versión exacta del estándar (pdfaid:part y pdfaid:conformance). Sin estos metadatos XMP correctamente configurados, el documento no es un PDF/A válido aunque visualmente sea indistinguible de uno que sí lo es.</p><p>La norma PDF/A prohíbe explícitamente el cifrado de metadatos: los metadatos XMP deben ser siempre accesibles sin contraseña, incluso en documentos con contraseña de apertura. Esta restricción es intencional: los sistemas de archivo a largo plazo deben poder indexar los documentos por sus metadatos sin necesidad de conocer la contraseña de apertura de cada documento individual. Como se explica en la guía sobre <a href='/es/blog/que-es-pdf-a-formato-archivo-largo-plazo'>qué es el formato PDF/A</a>, los documentos PDF/A están diseñados para ser completamente autocontenidos y preservables durante décadas sin dependencias de software externo.</p><p><strong>PDF/X y los metadatos para impresión profesional</strong></p><p>PDF/X (ISO 15930) es el estándar para el intercambio de ficheros en la industria de la impresión profesional. Los metadatos XMP requeridos por PDF/X incluyen información sobre el espacio de color, las intenciones de salida de impresión (OutputIntents), los perfiles ICC aplicados y el tipo de intercambio (PDF/X-1a para impresión ciega sin transparencias, PDF/X-4 para impresión con soporte de transparencias y capas). Estos metadatos técnicos son los que permiten al operador de imprenta saber exactamente cómo procesar el archivo sin necesidad de instrucciones adicionales.</p><p><strong>Metadatos Dublin Core en repositorios institucionales</strong></p><p>Los repositorios de publicaciones académicas (universidades, centros de investigación, administraciones públicas) usan el esquema Dublin Core (dc:title, dc:creator, dc:subject, dc:description, dc:publisher, dc:date, dc:type, dc:format, dc:identifier, dc:language) para los metadatos de los PDFs que reciben y distribuyen. Los PDFs enviados a repositorios institucionales sin metadatos Dublin Core configurados son clasificados manualmente por el personal del repositorio o rechazados automáticamente por el sistema de ingesta.</p><p><strong>Metadatos para sistemas de gestión documental (ECM/DMS)</strong></p><p>Los sistemas de gestión de contenido empresarial (SharePoint, Alfresco, M-Files, OpenText) extraen automáticamente los metadatos de los PDFs que se suben para clasificarlos, enrutarlos en flujos de trabajo de aprobación y recuperarlos mediante búsqueda. Un PDF con metadatos correctos (tipo de documento, departamento, fecha, número de versión, estado de aprobación) se indexa y clasifica automáticamente en segundos. Un PDF sin metadatos requiere intervención manual para su clasificación, lo que en organizaciones con volúmenes de 500 o más documentos por semana representa costes de gestión documental significativos. Las organizaciones que han implementado políticas de metadatos estándar para sus PDFs reportan reducciones del 35-60% en el tiempo de recuperación de documentos, según el benchmark de AIIM 2023 sobre gestión documental en entornos corporativos europeos.</p>
Preguntas frecuentes
¿Qué información personal pueden exponer los metadatos de un PDF sin que yo lo sepa?
Los metadatos de un PDF pueden revelar tu nombre real configurado en el sistema operativo, el nombre de tu empresa, el software exacto con número de versión que usaste para crearlo, la fecha y hora exactas de creación y modificación, y en imágenes embebidas incluso coordenadas GPS. Esta información es visible en 2 clics para cualquier receptor que sepa buscarla.
¿Puedo eliminar los metadatos de un PDF sin pagar Adobe Acrobat Pro?
Sí. ExifTool (gratuito, multiplataforma) elimina todos los metadatos con el comando exiftool -all:all= documento.pdf manteniendo el texto nativo seleccionable. También puedes imprimir el PDF a un nuevo PDF virtual en Windows o macOS, aunque este método convierte el texto a imagen. LibreOffice permite configurar los metadatos antes de exportar a PDF desde el documento fuente.
¿Los metadatos del PDF afectan al posicionamiento SEO en Google?
Sí, principalmente el campo Title. Google usa el título de los metadatos del PDF como posible texto del resultado en las búsquedas si no encuentra un H1 claro en el contenido. Un PDF sin título configurado aparece con el nombre del archivo en los resultados, que raramente incluye la keyword objetivo. Rellenar Title, Author y Keywords mejora la presentación del PDF en buscadores.
¿Un PDF protegido con contraseña también tiene los metadatos visibles?
Depende del tipo de protección. La contraseña de permisos (que impide impresión o copia de texto pero no la apertura) deja los metadatos básicos visibles sin contraseña. Solo la contraseña de apertura, que cifra todo el documento con AES-256, protege también los metadatos. Los documentos PDF/A por norma no pueden cifrar los metadatos, incluso con contraseña.
¿Qué metadatos son obligatorios en un PDF/A válido para archivo a largo plazo?
Un PDF/A válido según ISO 19005 requiere metadatos XMP con el esquema PDF/A ID que especifique pdfaid:part (número de parte: 1, 2 o 3) y pdfaid:conformance (nivel de conformidad: A, B o U). Sin estos campos XMP correctamente configurados, el documento no pasa la validación PDF/A aunque visualmente sea correcto. Herramientas como veraPDF verifican la conformidad de forma gratuita.
¿Es legal incluir el nombre de una persona en los metadatos de un PDF sin su consentimiento?
Bajo el RGPD, el nombre de una persona física en los metadatos de un PDF es un dato personal sujeto a las mismas reglas que el contenido visible. Si el PDF se distribuye externamente y el metadato identifica a una persona sin base legal o consentimiento, puede ser una infracción. Sanitizar los metadatos antes del envío externo es parte de las buenas prácticas de privacidad requeridas por el RGPD.