brucealmighty
Messages postés33Date d'inscriptionlundi 28 mai 2012StatutMembreDernière intervention14 août 2018
-
Modifié par brucealmighty le 19/07/2013 à 09:35
Bonjour à tous,
Je voudrais automatiser des opérations pour des fichiers PDF.
Je présente mon problème. Je reçois régulièrement des fichiers PDF d'une dizaine ou douzaine de pages. Je dois ensuite les découper en fichiers d'une seule page et les renommer selon une donnée qu'ils contiennent. Cette donnée se situe toujours au même endroit du fichier.
Pour le découpage en fichiers, j'utilise maintenant le logiciel "PDF Split And Merge Basic". Pour ce point-ci pas de problème donc.
Ce qui me pose problème, c'est la deuxième partie. En effet, j'ai pensé à convertir les PDF en fichiers textes :
- si je le fais avec Adobe, j'obtiens un formatage de fichier texte sympa, mais je dois faire toutes les conversions pour chaque fichier à la main (Fichier > Enregistrer Sous...) ;
- si je le fais avec un logiciel tierce, je peux le faire pour tous les fichiers en une seule fois, mais le formatage est horrible et pour récupérer les données, c'est assez compliqué.
L'idéal pour moi serait d'obtenir le formatage des fichiers texte comme le fait Adobe Reader avec un logiciel qui ferait les conversions en une seule fois.
Auriez-vous une solution ou une astuce qui permettrait d'optimiser ces opérations ?
Je m'étais penché sur une bibliothèque en Java (iText) mais j'ai rencontré pas mal de problèmes avec et la documentation n'était pas assez claire pour moi. Je précise que je ne suis pas un expert en programmation mais je ne suis pas fermé non plus (je connais Java, VBA, Python, C...).
J'ai également pensé à des logiciels de reconnaissance de caractère mais je ne suis pas un connaisseur dans le domaine (on peut peut-être exploiter la fonction Rechercher mais comment ?).