Logiciel de reconnaissance

maxime -  
sebsauvage Messages postés 33415 Statut Modérateur -
Bonjour,
je possède de nombreux .pdf de livres numérisés de la BNF. J'aimerai savoir si l'un d'entre vous connaissait un logiciel qui me permet de faire des recherches de mots dans ces pages qui sont en fait des images et non du texte. Car je ne veux pas m'amusez à tous traiter par OCR!!
En fait, j'aimerai que cela marche un peu comme google livre, ouù le moteur de recherche trouve un mot parmis les images des livres...

J'espere que mon fouilli est clair!!

en tout cas merci beaucoup...

4 réponses

jmp59 Messages postés 31960 Date d'inscription   Statut Contributeur Dernière intervention   5 738
 
Bonjour,

Ce genre de problème avec le format pdf a déjà été évoqué à plusieurs reprises sur ce forum.

Malheureusement, à cause du principe même de pdf, pas de solution.

Bye
0
sebsauvage Messages postés 33415 Statut Modérateur 15 667
 
On ne peut pas faire autrement que par de l'OCR.
0
max
 
Comment google books marche alors? Parce que j'ai eu cette idée en voyant leur site...
0
sebsauvage Messages postés 33415 Statut Modérateur 15 667
 
Comment google books marche alors?

Ils ont tout passé par des logiciels d'OCR, mais ne mettent que les images sur le site pour éviter que les auteurs des bouquins se fassent repiquer tout leur texte.
0

Discussions similaires