Recherche de texte dans un pdf "image"

alban56 -  
yannrz Messages postés 1 Date d'inscription   Statut Membre Dernière intervention   -
Bonjour à tous,

il m'arrive souvent de chercher des infos sur Google Books et j'aimerai savoir comment ils font pour permettre une recherche de texte dans des pdf ? En effet, lorsqu'on télécharge un des pdf, on s'apperçoit que chaque page est une image...

J'aimerai pouvoir créer une fonction comme celle là pour permettre la recherche dans certains documents numérisés mais je ne vois pas du tout comment ils font. A part peut-être l'utilisation de la reconnaissance de carractères supperposée à l'image de la page (je ne sais pas si je suis très clair...).

Merci d'avance à ceux qui pourront "éclairer ma lanterne" :)


PS : j'espère ne pas m'être trompé de section pour poster, ni d'avoir mis un titre trop flou...
A voir également:

3 réponses

hani_ Messages postés 333 Date d'inscription   Statut Membre Dernière intervention   20
 
le principe est assez complexe. mais pour faire simple : Ils ont scannés les pages de livres en faisant une reconnaissance de caractères pour chaque page.

le processus est bien plus complexe que ça mais dans le principe c'est comme ça que c'est fait.
0
alban56
 
Comme vous insistez bien sur la complexité du principe, je suppose qu'il est impossible de le reproduire ?

En tout cas, merci pour votre réponse :)
0
yannrz Messages postés 1 Date d'inscription   Statut Membre Dernière intervention  
 
Vous pouvez faire des recherches en passant par onenotes de Microsoft.
Il faut juste faire une impression du pdf et choisir l'imprimante one notes (si c'est installé), ensuite dans l'onglet recherche ça passe même sur les images.
0