PDF vers text
PDF2TXT
-
PDF2TXT -
PDF2TXT -
Bonjour,
Après 3 heures de tentatives, je me permet de poster sur ce forum.
Mon but est simple, je veux extraire le texte d'un PDF avec un script qui existe déjà.
J'ai trouvé 3-4 script sur google mais aucun ne fonctionne. Soit ils retournent une page blanche, soit il y a des erreurs à la compilation (script trop vieux j'imagine).
Est-ce que quelqu'un connaît un moyen simple pour récupérer ce texte ?
Merci
Après 3 heures de tentatives, je me permet de poster sur ce forum.
Mon but est simple, je veux extraire le texte d'un PDF avec un script qui existe déjà.
J'ai trouvé 3-4 script sur google mais aucun ne fonctionne. Soit ils retournent une page blanche, soit il y a des erreurs à la compilation (script trop vieux j'imagine).
Est-ce que quelqu'un connaît un moyen simple pour récupérer ce texte ?
Merci
1 réponse
-
Hello,
tu veux récupérer le texte du pdf peu importe le moyen ou il faut que ça soit en php impérativement ?
Si on est dans le premier cas tu as ce service : https://www.zamzar.com/-
-
Je vois cette bibliothèque sur github : https://github.com/smalot/pdfparser, la doc est bien faite, c'est bien codé et disponible via composer. Je ne sais pas si ça ouvrira correctement tes pdfs, j'ai fais un test avec un et le formattage est passé à la trappe mais les données ont été extraites, à toi de voir...
-
Je n'ai pas d'accès shell, seulement du FTP, (et les fonctions exec/shell_exec sont désactivées.)
C'est donc assez compliqué pour moi d'installer composer.
Je serais tenté d'installer PdfParser sans composer, mais il ne semble pas y avoir d'autoloader dans les fichier sur Github.
Je désespère... Est-ce que tu sais comment je pourrais m'en sortir pour faire ces "installation" ?
Merci du temps que tu as pris pour m'aider ! -
-
-