Ressources humaines : traiter les CV scannés avec l'OCR pour un recrutement efficace
Dans les services des ressources humaines, les CV arrivent sous des formats très variés : fichiers numériques envoyés par email, candidatures via un ATS (Applicant Tracking System), mais aussi CV papier déposés spontanément à l'accueil ou remis lors de forums de l'emploi et de salons professionnels. Ces CV papier constituent souvent un volume significatif de candidatures non structurées, difficiles à traiter et à conserver. La numérisation suivie de l'application de l'OCR transforme ces documents papier en PDF consultables, intégrables dans votre système de suivi des candidatures et facilement retrouvables lors d'un futur besoin de recrutement. Ce guide présente les meilleures pratiques pour les équipes RH, en tenant compte des obligations légales françaises en matière de conservation des données personnelles des candidats (RGPD, CNIL) et des spécificités du marché du travail français.
Numériser et indexer les CV papier avec l'OCR
Les CV papier présentent plusieurs contraintes : ils s'accumulent, se perdent, s'abîment et ne sont pas cherchables. La numérisation systématique des CV reçus physiquement est une bonne pratique qui permet de centraliser toutes les candidatures dans un seul système. Après numérisation (scan à 300 DPI, format JPG ou PDF image), l'application de l'OCR transforme les images de CV en PDF dont le texte est sélectionnable et cherchable. Vous pouvez alors rechercher par mot-clé (compétence, diplôme, logiciel, ville) dans l'ensemble de votre base de CV pour identifier rapidement les profils correspondant à une nouvelle offre d'emploi. Pour un cabinet de recrutement ou une grande entreprise gérant des centaines de candidatures, cette capacité de recherche est un gain de productivité considérable par rapport à la lecture manuelle de chaque CV. Les noms des fichiers PDF doivent être normalisés : [NOM]-[Prénom]-[Poste-visé]-[Date].pdf pour faciliter la navigation.
- 1Numérisez chaque CV papier dès sa réception, à 300 DPI en couleur ou niveaux de gris.
- 2Convertissez l'image en PDF via LazyPDF (outil Image vers PDF).
- 3Appliquez l'OCR sur le PDF pour rendre le texte du CV consultable.
- 4Renommez le PDF selon votre convention (MARTIN-Sophie-Responsable-Marketing-2026-03.pdf).
- 5Intégrez le PDF dans votre ATS ou dans le dossier candidat de votre base RH.
Conformité RGPD dans la gestion des CV numérisés
La gestion des CV, qu'ils soient papier ou numériques, est soumise au RGPD depuis le 25 mai 2018. En France, la CNIL a publié des recommandations spécifiques sur la gestion des candidatures. Les données personnelles des candidats (nom, adresse, date de naissance, nationalité) sont des données à caractère personnel qui doivent être traitées avec rigueur. Concernant la conservation, les CV et données de candidature ne peuvent être conservés que pour la durée nécessaire à la finalité du recrutement, soit généralement 2 ans après le dernier contact avec le candidat (référence CNIL). Au-delà, les données doivent être supprimées ou anonymisées. Il est donc essentiel de mettre en place un processus de revue annuelle des CV stockés et de supprimer ceux qui dépassent cette durée. Les candidats ont un droit d'accès, de rectification et d'effacement de leurs données. Si un candidat demande la suppression de son CV, vous devez pouvoir le retrouver et le supprimer rapidement — d'où l'importance d'une base de données organisée et consultable.
- 1Informez les candidats de la durée de conservation de leurs CV lors de la réception (mention légale).
- 2Configurez un rappel automatique dans votre calendrier pour la revue annuelle de la base de CV.
- 3Documentez dans votre registre des activités de traitement (RGPD) le traitement des CV numérisés.
- 4Mettez en place une procédure de réponse aux demandes d'effacement : délai de 30 jours maximum.
Intégrer les CV OCRisés dans un ATS ou un SIRH
Les logiciels ATS (Applicant Tracking System) comme Greenhouse, Workable, Recruitee, ou les solutions françaises comme Digital Recruiters, Boondmanager ou les modules recrutement des SIRH SAP SuccessFactors et Cegid acceptent les PDF comme format de dépôt de CV. Un PDF consultable (rendu tel par l'OCR) est bien mieux traité par ces systèmes qu'un simple PDF image : le parsing automatique du CV (extraction des informations clés dans les champs du profil candidat) fonctionne sur du texte, pas sur des images. L'OCR est donc une étape préalable indispensable pour que votre ATS puisse analyser automatiquement les CV scannés. Sans OCR, le CV est importé comme un simple fichier attaché sans analyse de contenu. Avec OCR, le parsing peut identifier le nom, les formations, les expériences et les compétences, et remplir automatiquement le profil candidat dans l'ATS.
- 1Appliquez l'OCR sur chaque CV scanné avant de l'importer dans votre ATS.
- 2Vérifiez la qualité du parsing automatique dans l'ATS : compétences et formations correctement extraites.
- 3Corrigez manuellement les erreurs de parsing liées à des mises en page complexes de CV.
- 4Activez les alertes de durée de conservation dans votre ATS pour les candidatures non abouties.
Gérer les candidatures spontanées déposées en salon de l'emploi
Les salons de l'emploi, les forums étudiants et les journées portes ouvertes génèrent souvent un volume important de CV papier remis directement par les candidats. Ces CV sont généralement collectés par les recruteurs terrain dans des chemises ou des boîtes. Leur traitement rapide après l'événement est essentiel pour ne pas perdre des candidatures de qualité et pour respecter les engagements pris lors des échanges (rappel dans la semaine, envoi d'informations complémentaires). La numérisation par lot de ces CV est une tâche que les équipes RH doivent planifier dans les 48h suivant le salon. Un scanner de bureau en mode batch, ou la photo individuelle au smartphone avec application photo-to-PDF, permet de traiter rapidement 50 à 100 CV en moins d'une heure. L'OCR appliqué ensuite rend l'ensemble de ces candidatures consultables et intégrables dans l'ATS. Pensez à noter sur chaque CV papier (ou dans un fichier complémentaire) les impressions de l'entretien informel et les points discutés lors du salon avant de procéder à la numérisation.
Questions fréquentes
L'OCR fonctionne-t-il bien sur des CV avec des mises en page complexes (colonnes, blocs graphiques) ?
Les CV modernes avec des mises en page très graphiques (colonnes, encadrés colorés, barres de compétences visuelles) peuvent poser des difficultés à l'OCR. Le texte dans les zones colorées ou sur fond foncé est moins bien reconnu. Pour améliorer les résultats, numérisez en couleur plutôt qu'en noir et blanc, et à 300 DPI minimum. Vérifiez toujours la qualité de la reconnaissance sur les sections clés.
Combien de temps puis-je conserver les CV numérisés des candidats non retenus ?
Selon les recommandations de la CNIL, les données de candidature peuvent être conservées 2 ans après le dernier contact avec le candidat si vous envisagez de le recontacter pour un futur poste. En cas de refus définitif ou si le candidat ne souhaite pas être recontacté, les données doivent être supprimées rapidement. Documentez votre politique de conservation dans votre registre RGPD.
Puis-je utiliser les CV numérisés pour des recrutements ultérieurs sans recontacter les candidats ?
Oui, si vous avez informé le candidat lors de la collecte que son CV sera conservé pour des opportunités futures et s'il n'a pas exercé son droit à l'effacement. Si vous recontactez un candidat pour un nouveau poste après une longue période, une vérification préalable que ses coordonnées sont à jour et qu'il consent toujours à être contacté est recommandée.
Comment sécuriser la base de CV numérisés contre les accès non autorisés ?
Stockez les PDF de CV dans un dossier ou un système avec contrôle d'accès strict : seuls les membres de l'équipe RH impliqués dans les recrutements concernés doivent y avoir accès. Chiffrez les disques ou serveurs de stockage. Évitez de partager des CV via email non chiffré. Documentez les accès dans votre registre de traitement RGPD. En cas de violation de données, vous avez 72 heures pour notifier la CNIL.