Comment extraire du texte en gras d'un fichier ?

koalala633 Messages postés 8 Date d'inscription   Statut Membre Dernière intervention   -  
 oblixx -

Bonjour,

j'aimerais savoir si c'est possible d'extraire toutes les phrases en gras dans un fichier pdf ou docx et de rediriger la sortie dans un fichier texte ou autre.J'ai plus de 80 pages et il y aussi des textes en gras dedans.

J'utilise Linux donc peut-etre en bash ou en python ? ou alors un logiciel conçu pour ça ?

Merci à vous.


Linux / Chrome 123.0.0.0

A voir également:

2 réponses

Panth33ra Messages postés 21924 Date d'inscription   Statut Membre Dernière intervention   Ambassadeur 1 995
 

Bonjour,

Lis cette réponse trouvée sur le Forum CCM.


0
koalala633 Messages postés 8 Date d'inscription   Statut Membre Dernière intervention   1
 

Bonjour,

de ce que je vois apparemment ce n'est pas possible sur les fichiers pdf mais si je le transforme en docx ? il y a pas une lib python qui fait ça ? ou une "astuce" avec bash ?

0
oblixx
 

Salut,

ça dépends du format du PDF, si c'est du texte ça peut fonctionner, si c'est une image c'est beaucoup plus dur car il va utiliser de l'OCR et pas forcément reprendre les caractère en gras, pour transformer un pdf en docx il y a beaucoup de site internet qui le propose si la taille n'est pas trop grande, sinon il y aussi adobe qui le fait très bien mais c'est payant, p-e qu'un des intervenants de ce forum a un programme gratuit, a voir...

0