Comment extraire du texte en gras d'un fichier ?

koalala633 Messages postés 8 Date d'inscription samedi 20 janvier 2024 Statut Membre Dernière intervention 17 juin 2024 - 27 mars 2024 à 11:25
 oblixx - 27 mars 2024 à 15:24

Bonjour,

j'aimerais savoir si c'est possible d'extraire toutes les phrases en gras dans un fichier pdf ou docx et de rediriger la sortie dans un fichier texte ou autre.J'ai plus de 80 pages et il y aussi des textes en gras dedans.

J'utilise Linux donc peut-etre en bash ou en python ? ou alors un logiciel conçu pour ça ?

Merci à vous.


Linux / Chrome 123.0.0.0

A voir également:

2 réponses

Panth33ra Messages postés 21020 Date d'inscription mercredi 8 juillet 2020 Statut Membre Dernière intervention 15 novembre 2024 Ambassadeur 1 864
27 mars 2024 à 11:37

Bonjour,

Lis cette réponse trouvée sur le Forum CCM.


0
koalala633 Messages postés 8 Date d'inscription samedi 20 janvier 2024 Statut Membre Dernière intervention 17 juin 2024 1
27 mars 2024 à 11:55

Bonjour,

de ce que je vois apparemment ce n'est pas possible sur les fichiers pdf mais si je le transforme en docx ? il y a pas une lib python qui fait ça ? ou une "astuce" avec bash ?

0

Salut,

ça dépends du format du PDF, si c'est du texte ça peut fonctionner, si c'est une image c'est beaucoup plus dur car il va utiliser de l'OCR et pas forcément reprendre les caractère en gras, pour transformer un pdf en docx il y a beaucoup de site internet qui le propose si la taille n'est pas trop grande, sinon il y aussi adobe qui le fait très bien mais c'est payant, p-e qu'un des intervenants de ce forum a un programme gratuit, a voir...

0