Recherche de texte inclus ds images d'un pdf

Quentinec -  
 Quentinec -
Bonjour,

Je voudrais savoir s'il est possible de permettre à adobe reader de rechercher du texte compris dans des images/schémas.

Car lorsque je convertis en pdf un word contenant des images avec des caractères texte, ma recherche de mots inclus sur ces schémas ne marche pas :(

Auriez vous des clés à ce problème ?

Merci d'avance pour votre aide.
A voir également:

3 réponses

dobo69 Messages postés 1587 Date d'inscription   Statut Membre Dernière intervention   832
 
bonsoir,

une image reste... une image.
Il n'y a plus de notion de texte, du moins pour les applis que tu cites (adobe reader et word). Il existe cependant des logiciels de reconnaissance de caractères qui "lisent" les textes contenus dans des images et les extraient (OCR). En voila un gratuit :
https://www.clubic.com/telecharger-fiche181816-freeocr.html
Cela peut peut être t'aider.
0
Quentinec
 
Bonjour,


Merci de ta réponse.
Je me suis renseigné sur les OCR, il y aurai une fonction de adobe pour appliquer un OCR comme indiqué ici :
http://help.adobe.com/fr_FR/Acrobat/8.0/Standard/help.html?content=WS2A3DD1FA-CFA5-4cf6-B993-159299574AB8.html

Mais je n'ai pas cette fonction.

Si je télécharge l'ORC que tu proposes, cette fonction va peut être apparaitre.
Je vais faire le test.

Au revoir
0
dobo69 Messages postés 1587 Date d'inscription   Statut Membre Dernière intervention   832
 
cette fonction est effectivement disponible dan adobe writer. je ne sais pas si elle l'est dans le writer....
0
Quentinec
 
Bonjour

J'ai appliqué l'ORC à mon document pdf avec adobe writer, adobe considère toujours mes images comme des images et n'applique l'ORC qu'à mon texte.

Pourtant dans google books ou scribd TOUS les mots des documents partagés par les internautes sont Taggés. Ces documents sont numérisés, et donc il y aurait possibilité d'appliquer une ORC pendant ou après numérisation ...

En tout cas je veu pas imprimer mon pdf pour le rescanner :)

Je suis un peu à cours d'idées !

Merci d'avance si vous voyez une nouvelle piste :)
0
Raymond PENTIER Messages postés 58993 Date d'inscription   Statut Contributeur Dernière intervention   17 360
 
Salut, Q.
Tu vois que ça ne sert à rien de poser 2 fois la même question dans le même forum la même semaine !
0
Quentinec
 
Une solution :

J'ai utilisé ReadIris, le logiciel marche assez bien et accepte du pdf comme source. Il ne reconnait pas tout mais s'utilise assez facilement.

Il renvoie bien un pdf en reconnaissant les mots des images. Ce qui me dérange qd même c'est que les mots des images sont stockés sous forme de signets, c pas très grave mais c pas très pro :)

Je regarde ça et je vous tiens au courant
0