PDF vers text

PDF2TXT -  
 PDF2TXT -
Bonjour,
Après 3 heures de tentatives, je me permet de poster sur ce forum.
Mon but est simple, je veux extraire le texte d'un PDF avec un script qui existe déjà.
J'ai trouvé 3-4 script sur google mais aucun ne fonctionne. Soit ils retournent une page blanche, soit il y a des erreurs à la compilation (script trop vieux j'imagine).

Est-ce que quelqu'un connaît un moyen simple pour récupérer ce texte ?

Merci
A voir également:

1 réponse

miramaze Messages postés 1429 Date d'inscription   Statut Contributeur Dernière intervention   92
 
Hello,

tu veux récupérer le texte du pdf peu importe le moyen ou il faut que ça soit en php impérativement ?

Si on est dans le premier cas tu as ce service : https://www.zamzar.com/
0
PDF2TXT
 
En PHP, je dois traiter l'information ensuite...
Merci quand même !
0
miramaze Messages postés 1429 Date d'inscription   Statut Contributeur Dernière intervention   92
 
Je vois cette bibliothèque sur github : https://github.com/smalot/pdfparser, la doc est bien faite, c'est bien codé et disponible via composer. Je ne sais pas si ça ouvrira correctement tes pdfs, j'ai fais un test avec un et le formattage est passé à la trappe mais les données ont été extraites, à toi de voir...
0
PDF2TXT
 
Je n'ai pas d'accès shell, seulement du FTP, (et les fonctions exec/shell_exec sont désactivées.)
C'est donc assez compliqué pour moi d'installer composer.
Je serais tenté d'installer PdfParser sans composer, mais il ne semble pas y avoir d'autoloader dans les fichier sur Github.
Je désespère... Est-ce que tu sais comment je pourrais m'en sortir pour faire ces "installation" ?
Merci du temps que tu as pris pour m'aider !
0
miramaze Messages postés 1429 Date d'inscription   Statut Contributeur Dernière intervention   92
 
Tu peux installer en local et envoyer le tout en ftp non ?
0
PDF2TXT
 
Ok, je vais faire ça.
0