Lecture et recherche dans pdf

Fermé
Aketus Messages postés 20 Date d'inscription samedi 2 octobre 2010 Statut Membre Dernière intervention 21 décembre 2022 - 2 oct. 2010 à 18:14
Aketus Messages postés 20 Date d'inscription samedi 2 octobre 2010 Statut Membre Dernière intervention 21 décembre 2022 - 3 oct. 2010 à 14:24
Bonjour,

Je suis confronté à un problème de recherche dans certains fichiers PDF.
J'utilise des fichiers d'ouvrages anciens (hors de droits et public, donc dans la légalité) pour des travaux littéraires. Certains sont volumineux, de 200 à 600 pages, et je souhaite faire des recherches à partir d'un terme quelconque.
Aucun problème avec certains fichiers mais aucun résultat avec d'autres.
J'utilise la fonction "recherche avancée". Quand la recherche n'aboutit pas j'obtiens le message suivant "Reader a terminé la recherche dans le document. Aucun résultat.". Alors que le mot recherché existe bien dans le fichier.
J'ai regardé dans les propriétés d'un fichier avec lequel je rencontre ces difficultés, il n'y a pas de protection.
Auriez-vous une solution ?
Merci pour votre aide.
A voir également:

4 réponses

le hollandais volant Messages postés 4998 Date d'inscription samedi 8 mars 2008 Statut Membre Dernière intervention 23 décembre 2023 1 057
2 oct. 2010 à 21:15
Salut !

As-tu essayé avec le lecteur Sumatra PDF ?

Sinon, il faut savoir que les fichiers PDF sont des fichiers qui peuvent êtres fait de tel sorte qui l'information du texte ou des images n'existe pas sous forme de texte.

C'est un peu bizarre à expliquer, mais c'est comme si tu avais une image avec du texte à l'intérieur : une recherche ne pourra jamais trouver le texte.
0
Aketus Messages postés 20 Date d'inscription samedi 2 octobre 2010 Statut Membre Dernière intervention 21 décembre 2022
3 oct. 2010 à 00:19
Bonjour,
Je crains effectivement d'être face à un fichier image. Mais alors comment extraire le texte de l'ouvrage de 300 pages environ que j'utilise actuellement ?
Merci pour votre aide
0
le hollandais volant Messages postés 4998 Date d'inscription samedi 8 mars 2008 Statut Membre Dernière intervention 23 décembre 2023 1 057
3 oct. 2010 à 13:59
C'est à ma connaissance pas très possible.

À moins d'utiliser un logiciel de reconnaissance optique de caractères. (OCR).

Google propose un service gratuit pour ça, mais faut le faire image par image.
0
Aketus Messages postés 20 Date d'inscription samedi 2 octobre 2010 Statut Membre Dernière intervention 21 décembre 2022
3 oct. 2010 à 14:24
J'ai trouvé sur Google docs la fonction qui permet de faire une reconnaissance OCR à partir de fichiers PDF image. Mais c'est limité à 2Mo par PDF, pour moi cela représente environ 4 pages, et j'ai des centaines de pages à traiter....Ce n'est pas la bonne solution, il me faudrait un logiciel qui puisse lire du texte directement dans un fichier image, l'oiseau rare en quelque sorte !

Merci pour vos conseils.
0