PDF vers text

Fermé
PDF2TXT - 27 juin 2015 à 16:08
 PDF2TXT - 28 juin 2015 à 21:44
Bonjour,
Après 3 heures de tentatives, je me permet de poster sur ce forum.
Mon but est simple, je veux extraire le texte d'un PDF avec un script qui existe déjà.
J'ai trouvé 3-4 script sur google mais aucun ne fonctionne. Soit ils retournent une page blanche, soit il y a des erreurs à la compilation (script trop vieux j'imagine).

Est-ce que quelqu'un connaît un moyen simple pour récupérer ce texte ?

Merci
A voir également:

1 réponse

miramaze Messages postés 1429 Date d'inscription mercredi 29 juillet 2009 Statut Contributeur Dernière intervention 1 mai 2022 92
27 juin 2015 à 16:39
Hello,

tu veux récupérer le texte du pdf peu importe le moyen ou il faut que ça soit en php impérativement ?

Si on est dans le premier cas tu as ce service : https://www.zamzar.com/
0
En PHP, je dois traiter l'information ensuite...
Merci quand même !
0
miramaze Messages postés 1429 Date d'inscription mercredi 29 juillet 2009 Statut Contributeur Dernière intervention 1 mai 2022 92
Modifié par miramaze le 27/06/2015 à 19:22
Je vois cette bibliothèque sur github : https://github.com/smalot/pdfparser, la doc est bien faite, c'est bien codé et disponible via composer. Je ne sais pas si ça ouvrira correctement tes pdfs, j'ai fais un test avec un et le formattage est passé à la trappe mais les données ont été extraites, à toi de voir...
0
Je n'ai pas d'accès shell, seulement du FTP, (et les fonctions exec/shell_exec sont désactivées.)
C'est donc assez compliqué pour moi d'installer composer.
Je serais tenté d'installer PdfParser sans composer, mais il ne semble pas y avoir d'autoloader dans les fichier sur Github.
Je désespère... Est-ce que tu sais comment je pourrais m'en sortir pour faire ces "installation" ?
Merci du temps que tu as pris pour m'aider !
0
miramaze Messages postés 1429 Date d'inscription mercredi 29 juillet 2009 Statut Contributeur Dernière intervention 1 mai 2022 92
28 juin 2015 à 21:43
Tu peux installer en local et envoyer le tout en ftp non ?
0
Ok, je vais faire ça.
0