Comment extraire du texte en gras d'un fichier ?
oblixx -
Bonjour,
j'aimerais savoir si c'est possible d'extraire toutes les phrases en gras dans un fichier pdf ou docx et de rediriger la sortie dans un fichier texte ou autre.J'ai plus de 80 pages et il y aussi des textes en gras dedans.
J'utilise Linux donc peut-etre en bash ou en python ? ou alors un logiciel conçu pour ça ?
Merci à vous.
Linux / Chrome 123.0.0.0
- Comment extraire du texte en gras d'un fichier ?
- Comment réduire la taille d'un fichier - Guide
- Comment ouvrir un fichier epub ? - Guide
- Fichier bin - Guide
- Texte en gras - Guide
- Fichier rar - Guide
2 réponses
Bonjour,
Lis cette réponse trouvée sur le Forum CCM.
Bonjour,
de ce que je vois apparemment ce n'est pas possible sur les fichiers pdf mais si je le transforme en docx ? il y a pas une lib python qui fait ça ? ou une "astuce" avec bash ?
Salut,
ça dépends du format du PDF, si c'est du texte ça peut fonctionner, si c'est une image c'est beaucoup plus dur car il va utiliser de l'OCR et pas forcément reprendre les caractère en gras, pour transformer un pdf en docx il y a beaucoup de site internet qui le propose si la taille n'est pas trop grande, sinon il y aussi adobe qui le fait très bien mais c'est payant, p-e qu'un des intervenants de ce forum a un programme gratuit, a voir...