Recherche logiciel pour extraire du texte PDF [Résolu/Fermé]

Signaler
Messages postés
11
Date d'inscription
jeudi 13 mai 2010
Statut
Membre
Dernière intervention
29 novembre 2012
-
Messages postés
1
Date d'inscription
mercredi 14 octobre 2015
Statut
Membre
Dernière intervention
14 octobre 2015
-
Bonjour à tous,

Je suis a la recherche d'un logiciel qui pourrait extraire des informations dans un fichier PDF.
Ex: j'ai un fichier client01.pdf et je voudrais récupérer le texte qui ce trouve entre les mots "Nom:" et "Prénom:" etc..
pour me faire une base de donnée.

Vu que j'ai beaucoup de fichiers PDF, le copier/coller est un peu long!

Au pire j'ai vu qu'il est possible de transformer du PDF en DOC/RTF.
Donc si la chose est possible sur des fichiers DOC/RTF je suis preneur d'une solution.


Merci.

Doo89

6 réponses

Messages postés
1
Date d'inscription
mercredi 14 octobre 2015
Statut
Membre
Dernière intervention
14 octobre 2015
7
essayez ce logiciel: http://www.convertersinfo.com/fr/pdf/comment_extraire_un_texte_dun_pdf.php
il pourrait extraire l'information et transformer le en doc
9
Merci

Quelques mots de remerciements seront grandement appréciés. Ajouter un commentaire

CCM 65492 internautes nous ont dit merci ce mois-ci

Messages postés
170
Date d'inscription
dimanche 24 janvier 2010
Statut
Membre
Dernière intervention
18 janvier 2014
26
Est ce que ce logiciel pourrait t'aider....................? Il s'appelle "PDF Split and Merge"

https://framalibre.org
Messages postés
11
Date d'inscription
jeudi 13 mai 2010
Statut
Membre
Dernière intervention
29 novembre 2012
9
Merci pour ta réponse, mais je viens de tester ce logiciel, et il ne convient pas réellemnt pour ce que je voudrais faire, il permet de découper le pdf en plusieurs pages / fichiers, mais pas avec la précision que j'ai besoin.

Il faut que dans mon fichier PDF ou DOC je puisse récupérer un mot ou une phrase entre deux mots/phrases définis!

Je ne suis pas très doué en programmation mais il doit bien y avoir un script qui récupére un morceau de texte dans un fichier, avec comme condition de récupérer le texte entre la variable x et y ou x serait par exemple "bla bla bla nom:" et b = "bla bla bla adresse :"

Enfin pas facile de trouver.
Messages postés
170
Date d'inscription
dimanche 24 janvier 2010
Statut
Membre
Dernière intervention
18 janvier 2014
26
En voilà un autre qui cette fois, est annoncé "freeware". Je pense que ça devrait répondre à ton attente!

http://www.a-pdf.com/text/index.htm
Messages postés
11
Date d'inscription
jeudi 13 mai 2010
Statut
Membre
Dernière intervention
29 novembre 2012
9
J'ai regardé ce programme transforme bien le PDF en TXT, il ne me reste plus qu'à trouver comment récupérer dans mon texte mes données, je vais fermer le sujet en te remerciant, et ouvrir un nouveau sujet pour mon probleme d'extraction de données dans le fichier texte..


Sinon j'ai trouvé sur le site que tu m'a donné à l'adresse: http://www.a-pdf.com/data-extractor/index.htm un logiciel qui pourrait directemtn répondre a mes besoin, mais je dois le tester sur plusieurs PDF, avec des données variables.
Il est payant, ma patronne va être contente :-)


Encore merci lap1bis pour ton aide.
Messages postés
170
Date d'inscription
dimanche 24 janvier 2010
Statut
Membre
Dernière intervention
18 janvier 2014
26
Désolé alors de ne pouvoir t'aider d'avantage pour l'instant...............Je continue de fouiller et si je trouve..........
Messages postés
11
Date d'inscription
jeudi 13 mai 2010
Statut
Membre
Dernière intervention
29 novembre 2012
9
Merci de ton aide
Messages postés
170
Date d'inscription
dimanche 24 janvier 2010
Statut
Membre
Dernière intervention
18 janvier 2014
26
J'ai trouvé ça...................

http://www6.pdfxchange-fr.com/?tdfs=1&searchbox=1&showDomain=1

Attention: ça me parait être un logiciel payant. Il y a cependant une version d'évaluation qui pourrait peut-être t'aider sur ton travail du moment ?
Messages postés
11
Date d'inscription
jeudi 13 mai 2010
Statut
Membre
Dernière intervention
29 novembre 2012
9
Je viens de regarder et hélàs ça resemble techniquement à "PDF Split and Merge" , donc toujours pas bon.
Merci.
Messages postés
4
Date d'inscription
vendredi 23 novembre 2012
Statut
Membre
Dernière intervention
25 novembre 2012

un logiciel qui pourrait être au poil pour ton travail ... readiris 14
une version Démo est disponible

pour info , j'utilise la V 10 et c'est super , tu peux extraire l'intégralité d'un texte , ou , comme tu semble vouloir faire , une section , voir 2 mots ....c'est toi qui encadre les zones qui t'intéresse et après , c'est lui qui extrait en .doc ou .txt

voici le lien :
http://www.irislink.com/c4-646-63/I-R-I-S----Logiciels-OCR-et-solutions-de-gestion-de-documents.aspx
Messages postés
11
Date d'inscription
jeudi 13 mai 2010
Statut
Membre
Dernière intervention
29 novembre 2012
9
Je te remercie, mais comme je n'avais pas trouvé de solution j'ai tout fais à la main.
Mais je vais quand même regarder ce logiciel.