Cómo convertir PDF a Word para facilitar la traducción profesional
Para un traductor profesional, recibir un documento en PDF es una señal de alerta. El PDF es perfecto para la distribución y el archivo, pero es el formato menos conveniente para el trabajo de traducción. Sin acceso al texto editable, el traductor tiene que copiar fragmento a fragmento, lo que es tedioso, propenso a errores y incompatible con las herramientas de traducción asistida por ordenador (CAT tools) que son estándar en la industria. La conversión de PDF a Word antes de enviar un documento a traducción no es solo una comodidad: es una buena práctica que mejora la calidad del trabajo, reduce el tiempo y el coste de traducción, y facilita el control de calidad posterior. Esta guía está dirigida tanto a los traductores que reciben PDFs de sus clientes como a los clientes que preparan documentos para su traducción. Cubrimos el proceso de conversión, cómo preparar el Word resultante para las CAT tools, qué hacer con PDFs escaneados y cómo gestionar el formato del documento traducido.
Por qué los traductores prefieren Word sobre PDF
La razón principal es la compatibilidad con las herramientas de traducción asistida (CAT tools). Programas como SDL Trados Studio, memoQ, Wordfast, OmegaT y Déjà Vu trabajan con segmentos de texto: dividen el documento en unidades traducibles (normalmente frases) y permiten al traductor trabajar segmento a segmento mientras construyen una memoria de traducción. Estas herramientas importan directamente archivos .docx y producen una traducción en un documento Word con el mismo formato que el original, pero en el idioma de destino. También permiten aprovechar las memorias de traducción para reutilizar traducciones anteriores de segmentos idénticos o similares, lo que reduce el tiempo y garantiza la consistencia terminológica. Con un PDF, el traductor no puede usar estas herramientas directamente. Tiene que copiar el texto manualmente, traducir en un documento separado y luego intentar replicar el formato original, lo que multiplica el tiempo de trabajo y aumenta el riesgo de errores de maquetación. Además, la revisión es mucho más eficiente en Word. El cliente puede usar el control de cambios para comparar el original con la traducción, y el revisor puede añadir comentarios directamente en el documento. En PDF, estas funcionalidades son mucho más limitadas o requieren software adicional.
- 1Convierte el PDF a Word antes de enviarlo al traductor usando LazyPDF.
- 2Verifica que el texto del Word es completamente editable y no hay secciones como imagen.
- 3Comunica al traductor qué herramientas CAT usa para asegurarte de que el formato Word es compatible.
- 4Acuerda con el traductor el formato de entrega de la traducción (Word con formato, solo texto, etc.).
Preparar el documento Word para las CAT tools
No cualquier documento Word es óptimo para las CAT tools. Una buena preparación reduce los problemas de importación y mejora la calidad de la segmentación. Lo primero es verificar que el texto es real y editable, no imágenes de texto. Si al seleccionar el texto en Word puedes seleccionarlo y copiarlo normalmente, es texto editable. Si al seleccionar aparece resaltada toda la imagen, es una imagen de texto y necesita OCR antes de poder traducirse. Elimina los elementos no traducibles del documento antes de enviarlo. Los números de página, los encabezados y pies de página con logos, las fórmulas matemáticas y los códigos de producto generalmente no se traducen. Si están incluidos en el documento Word, la CAT tool los segmentará e intentará traducirlos, creando trabajo innecesario. Márcalos como 'no traducir' si la herramienta lo permite, o extráelos antes de enviar. Usa estilos de párrafo consistentes. Los CAT tools segmentan el texto basándose en la estructura del documento. Los estilos correctos (Título 1, Título 2, Normal, Lista) ayudan a la herramienta a segmentar correctamente y a producir un documento traducido con el mismo formato. Crea un glosario de términos clave antes de la traducción. Si el documento tiene terminología especializada (legal, médica, técnica), proporciona un glosario de términos en el idioma de origen con sus traducciones preferidas en el idioma de destino. Las CAT tools pueden importar glosarios y sugerir automáticamente las traducciones cuando aparece el término.
- 1Convierte el PDF a Word con LazyPDF y verifica que el texto es completamente editable.
- 2Elimina o marca como no traducibles los elementos que no necesitan traducción.
- 3Aplica estilos de párrafo consistentes para facilitar la segmentación por las CAT tools.
- 4Prepara un glosario de términos clave para garantizar la consistencia terminológica.
- 5Comprime el archivo si es muy pesado por las imágenes incrustadas antes de enviarlo.
Gestión de PDFs escaneados para traducción
Los PDFs escaneados son el mayor desafío en la cadena de traducción. No contienen texto extraíble y requieren OCR antes de poder trabajar con ellos. El proceso correcto para PDFs escaneados es: primero aplicar OCR con LazyPDF para crear un PDF con capa de texto, y luego convertir ese PDF a Word para obtener el texto editable. La calidad del OCR es crucial aquí porque los errores de reconocimiento llegarán al documento que recibe el traductor y causarán problemas. Si el OCR comete un error y la herramienta CAT segmenta 'recibimicnto' en lugar de 'recibimiento', el traductor tendrá una cadena de texto errónea que traducir, y la memoria de traducción almacenará la versión incorrecta. Por eso, después de aplicar OCR y antes de enviar al traductor, es responsabilidad del cliente (no del traductor) revisar el texto reconocido y corregir los errores de OCR. Es especialmente importante revisar: nombres propios, términos técnicos, cifras y unidades de medida, y elementos con caracteres especiales. Alternativamente, algunos traductores especializados en trabajos de alta complejidad o en sectores donde los PDFs escaneados son comunes (legal, médico, histórico) tienen experiencia con el flujo de OCR + corrección + traducción y pueden ofrecerlo como servicio integrado. Si el PDF escaneado es de muy mala calidad (imagen borrosa, papel amarillento, escritura a mano), considera si es más eficiente contratar a alguien para reescribirlo manualmente en Word antes de enviarlo a traducción. El coste de la corrección manual puede ser menor que el coste adicional de un trabajo de traducción más difícil.
- 1Aplica OCR al PDF escaneado con LazyPDF para extraer el texto.
- 2Revisa y corrige los errores de OCR antes de enviar al traductor.
- 3Convierte el PDF con OCR a Word para obtener el archivo editable.
- 4Notifica al traductor el origen del documento (escaneado) para que sepa qué esperar.
- 5Acuerda con el traductor si la revisión del OCR es responsabilidad del cliente o del traductor.
Gestionar el formato del documento traducido
Una vez que el traductor entrega el documento Word traducido, el cliente a menudo necesita convertirlo de vuelta a PDF para distribución. En este paso, es importante mantener el mismo estándar de calidad que en la conversión original. Verifica el documento Word traducido antes de convertir a PDF. El texto en el idioma de destino puede ser más largo o más corto que el original (por ejemplo, el alemán tiende a ser más largo que el español, y el japonés tiende a ser más compacto). Estos cambios de longitud pueden hacer que el diseño del documento se desajuste: páginas que antes tenían texto equilibrado ahora pueden tener mucho espacio en blanco o, por el contrario, texto que se desborda. Revisa especialmente los encabezados, pies de página, cuadros de texto y tablas. Estos elementos tienen espacio limitado y los cambios de longitud del texto traducido son más problemáticos aquí que en el cuerpo del documento. Una vez verificado el formato, convierte el Word traducido a PDF con LazyPDF Word to PDF o con la exportación nativa de Word. Verifica el PDF resultante: comprueba que los márgenes son correctos, que el índice de contenidos (si existe) se ha actualizado con las entradas en el idioma de destino y que todos los hipervínculos siguen funcionando. Guarda siempre el archivo Word del documento traducido, no solo el PDF. Si el cliente pide cambios en la traducción, el traductor necesita el Word editable para realizar las correcciones.
Preguntas frecuentes
¿Debo enviar el PDF o el Word al traductor?
Siempre envía el Word al traductor. Convierte el PDF a Word con LazyPDF antes de enviar el documento. Esto permite al traductor usar herramientas CAT, mantener el formato correctamente, aplicar memorias de traducción y entregar el documento traducido en el mismo formato que el original, listo para revisión y uso.
¿Las CAT tools pueden importar directamente un PDF?
Algunas CAT tools modernas (como SDL Trados Studio 2021 en adelante) pueden importar PDFs directamente, pero con limitaciones importantes: solo funcionan con PDFs digitales (no escaneados), el texto puede segmentarse incorrectamente y el formato del documento de destino puede ser muy diferente al original. La calidad es significativamente mejor cuando se trabaja con un Word bien preparado.
¿Qué hago si el PDF tiene texto en varios idiomas?
Si el PDF tiene texto en varios idiomas (por ejemplo, un contrato bilingüe o un documento con notas en otro idioma), comunícaselo al traductor antes de empezar. Las CAT tools tienen dificultades con documentos multilingües porque aplican las reglas de segmentación del idioma configurado. Para documentos bilingües, puede ser necesario separar el texto de cada idioma en documentos separados o marcar explícitamente qué secciones deben traducirse.
¿Cómo mantengo el formato cuando el texto traducido es más largo que el original?
Este es un problema frecuente, especialmente con pares de idiomas con diferencias de longitud significativas (inglés-alemán, inglés-finés). Las soluciones habituales son: reducir ligeramente el tamaño de fuente en el texto traducido, condensar el espaciado entre líneas, reorganizar el diseño para dar más espacio al texto o dividir el documento en más páginas. En documentos con diseño ajustado, es recomendable trabajar con un maquetador además del traductor para el resultado final.