Recherche de texte dans un pdf "image"

Fermé
alban56 - 24 oct. 2008 à 13:30
yannrz Messages postés 1 Date d'inscription mercredi 17 juillet 2013 Statut Membre Dernière intervention 17 juillet 2013 - 17 juil. 2013 à 14:41
Bonjour à tous,

il m'arrive souvent de chercher des infos sur Google Books et j'aimerai savoir comment ils font pour permettre une recherche de texte dans des pdf ? En effet, lorsqu'on télécharge un des pdf, on s'apperçoit que chaque page est une image...

J'aimerai pouvoir créer une fonction comme celle là pour permettre la recherche dans certains documents numérisés mais je ne vois pas du tout comment ils font. A part peut-être l'utilisation de la reconnaissance de carractères supperposée à l'image de la page (je ne sais pas si je suis très clair...).

Merci d'avance à ceux qui pourront "éclairer ma lanterne" :)


PS : j'espère ne pas m'être trompé de section pour poster, ni d'avoir mis un titre trop flou...
A voir également:

3 réponses

hani_ Messages postés 333 Date d'inscription lundi 22 septembre 2008 Statut Membre Dernière intervention 18 novembre 2009 20
24 oct. 2008 à 13:55
le principe est assez complexe. mais pour faire simple : Ils ont scannés les pages de livres en faisant une reconnaissance de caractères pour chaque page.

le processus est bien plus complexe que ça mais dans le principe c'est comme ça que c'est fait.
0
Comme vous insistez bien sur la complexité du principe, je suppose qu'il est impossible de le reproduire ?

En tout cas, merci pour votre réponse :)
0
yannrz Messages postés 1 Date d'inscription mercredi 17 juillet 2013 Statut Membre Dernière intervention 17 juillet 2013
17 juil. 2013 à 14:41
Vous pouvez faire des recherches en passant par onenotes de Microsoft.
Il faut juste faire une impression du pdf et choisir l'imprimante one notes (si c'est installé), ensuite dans l'onglet recherche ça passe même sur les images.
0