Extraire texte d'un pdf
Bonjour à tous,
Je suis contente d'être parmi vous. Je suis en train de travailler sur un programme de chatbot avec NLP, mais la base de donnée qu'on me donne est un pdf (c'est la constitution d'un pays) . Je dois convertir ce fichier pdf en fichier texte duquel je dois extraire les données. J'aimerais laisser seulement les articles (titre, texte).
Voici le lien vers le fichier pdf.
Déjà je vous dis un grand merci pour votre aide
Je suis contente d'être parmi vous. Je suis en train de travailler sur un programme de chatbot avec NLP, mais la base de donnée qu'on me donne est un pdf (c'est la constitution d'un pays) . Je dois convertir ce fichier pdf en fichier texte duquel je dois extraire les données. J'aimerais laisser seulement les articles (titre, texte).
Voici le lien vers le fichier pdf.
Déjà je vous dis un grand merci pour votre aide
A voir également:
- Extraire le texte d'un pdf
- Lire le coran en français pdf - Télécharger - Histoire & Religion
- Extraire une video youtube - Guide
- Extraire le son d'une vidéo - Guide
- Extraire image pdf - Guide
- Extraire texte d'une image - Guide
5 réponses
yg_be
Messages postés
23541
Date d'inscription
Statut
Contributeur
Dernière intervention
Ambassadeur
1 584
bonjour,
as-tu essayé de copier le texte du pdf vers notepad?
as-tu essayé de copier le texte du pdf vers notepad?
Oui, le pdf est déjà en notepad. J'ai envoyé le lien pdf c'est pour que vous puissiez regarder le format du fichier. Je travail sur colab
Bonjour,
Je pense que la question de yg_be est plutôt, pourquoi ne pas copier coller le pdf dans un fichier texte et faire fonctionner ton programme sur ce fichier texte. Après, plutôt que de passer par un fichier texte intermédiaire, tu peux sans doute utiliser
Bonne chance
Je pense que la question de yg_be est plutôt, pourquoi ne pas copier coller le pdf dans un fichier texte et faire fonctionner ton programme sur ce fichier texte. Après, plutôt que de passer par un fichier texte intermédiaire, tu peux sans doute utiliser
pdfminer. Un exemple d'utilisation ici.
Bonne chance
Bonjour,
Merci pour votre aide. c'est avec le fichier txt que je dois travailler, j'ai déjà convertis ce fichier en txt.
Le problème c'est que les données sont en désordre , ce que je veux c'est de laisser seulement les données importantes à savoir les articles et d'enlever les restes.
Merci pour votre aide. c'est avec le fichier txt que je dois travailler, j'ai déjà convertis ce fichier en txt.
Le problème c'est que les données sont en désordre , ce que je veux c'est de laisser seulement les données importantes à savoir les articles et d'enlever les restes.
Vous n’avez pas trouvé la réponse que vous recherchez ?
Posez votre question