Recherche de texte dans un pdf "image"
alban56
-
yannrz Messages postés 1 Date d'inscription Statut Membre Dernière intervention -
yannrz Messages postés 1 Date d'inscription Statut Membre Dernière intervention -
Bonjour à tous,
il m'arrive souvent de chercher des infos sur Google Books et j'aimerai savoir comment ils font pour permettre une recherche de texte dans des pdf ? En effet, lorsqu'on télécharge un des pdf, on s'apperçoit que chaque page est une image...
J'aimerai pouvoir créer une fonction comme celle là pour permettre la recherche dans certains documents numérisés mais je ne vois pas du tout comment ils font. A part peut-être l'utilisation de la reconnaissance de carractères supperposée à l'image de la page (je ne sais pas si je suis très clair...).
Merci d'avance à ceux qui pourront "éclairer ma lanterne" :)
PS : j'espère ne pas m'être trompé de section pour poster, ni d'avoir mis un titre trop flou...
il m'arrive souvent de chercher des infos sur Google Books et j'aimerai savoir comment ils font pour permettre une recherche de texte dans des pdf ? En effet, lorsqu'on télécharge un des pdf, on s'apperçoit que chaque page est une image...
J'aimerai pouvoir créer une fonction comme celle là pour permettre la recherche dans certains documents numérisés mais je ne vois pas du tout comment ils font. A part peut-être l'utilisation de la reconnaissance de carractères supperposée à l'image de la page (je ne sais pas si je suis très clair...).
Merci d'avance à ceux qui pourront "éclairer ma lanterne" :)
PS : j'espère ne pas m'être trompé de section pour poster, ni d'avoir mis un titre trop flou...
A voir également:
- Rechercher un mot dans un pdf scanné
- Lire le coran en français pdf - Télécharger - Histoire & Religion
- Bible hébreu traduction mot à mot pdf - Télécharger - Vie quotidienne
- Trousseau mot de passe iphone - Guide
- Rechercher un mot dans word - Guide
- Mettre un mot de passe sur un pdf - Guide
3 réponses
le principe est assez complexe. mais pour faire simple : Ils ont scannés les pages de livres en faisant une reconnaissance de caractères pour chaque page.
le processus est bien plus complexe que ça mais dans le principe c'est comme ça que c'est fait.
le processus est bien plus complexe que ça mais dans le principe c'est comme ça que c'est fait.
Comme vous insistez bien sur la complexité du principe, je suppose qu'il est impossible de le reproduire ?
En tout cas, merci pour votre réponse :)
En tout cas, merci pour votre réponse :)