Extraire les infos d'un pdf pour les enregistrer dans la BD
polko123
Messages postés
1
Date d'inscription
Statut
Membre
Dernière intervention
-
pierre.lagoutte Messages postés 35 Date d'inscription Statut Membre Dernière intervention -
pierre.lagoutte Messages postés 35 Date d'inscription Statut Membre Dernière intervention -
Bonjour
je travail sur un système GED pour mon stage accademique. j'ai rencontrer un Pb au niveau d'extraction des données d'un pdf pour l'enregistrer dans une base de de donnée.
j'aimerai savoir si vous avez une idée pour pour cette extraction
je travail sur un système GED pour mon stage accademique. j'ai rencontrer un Pb au niveau d'extraction des données d'un pdf pour l'enregistrer dans une base de de donnée.
j'aimerai savoir si vous avez une idée pour pour cette extraction
A voir également:
- Extraire les infos d'un pdf pour les enregistrer dans la BD
- Lire le coran en français pdf - Télécharger - Histoire & Religion
- Audacity enregistrer son pc - Guide
- Extraire une video youtube - Guide
- Extraire image pdf - Guide
- Extraire le son d'une vidéo - Guide
1 réponse
Bonjour,
Je n'ai jamais travaillé sur cet aspect... Essayez d'ouvrir votre PDF avec un bloc-notes afin de voir si les infos à extraire sont présentes en clair. Si oui, vous devriez vous en sortir avec le regex.
Désolé de ne pas vous donner une réponse plus précise, je n'ai jamais travaillé sur la manipulation de fichiers PDF.
Cordialement
Je n'ai jamais travaillé sur cet aspect... Essayez d'ouvrir votre PDF avec un bloc-notes afin de voir si les infos à extraire sont présentes en clair. Si oui, vous devriez vous en sortir avec le regex.
Désolé de ne pas vous donner une réponse plus précise, je n'ai jamais travaillé sur la manipulation de fichiers PDF.
Cordialement
imaginons que je sache extraire des données d'un pdf en PHP (ça n'est pas le cas)
En passant sur le forum je vois ça
Une question bien titrée, en PHP, je connais la réponse, mais pierre.lagoute y a déjà répondu, pas besoin que j'aille voir.
Répondre qu'on ne sait pas n'apporte rien au demandeur si ce n'est une fausse joie quand il voit que quelqu'un a répondu.
Et pour ceux qui savent répondre, un certain nombre ne lira pas la question, pensant le sujet pris en main.
J'ai apporté un élément de réponse : si le texte qu'il veut extraire se trouve en clair dans le fichier "source" du PDF, il suffisait d'analyser ce fichier source avec des regex pour en extraire l'information.
Je n'ai pas la réponse entière, certes, mais ça ne m'empêche pas de doonner ce que je sais.
Donc quand on l'ouvre avec le bloc note ça affiche des hiéroglyphes....