Récupérer le texte d'un PDF sous DELPHI

Leam -  
 Leam -
Bonjour,

Je souhaite scanner le texte présent dans les fichiers PDF de mon Disque Dur.

Sous OpenOffice j'ai écris cette phrase :
"Bonjour
Ceci est une phrase pour savoir si je suis capable de la retrouver dans un fichier PDF."

Puis je l'ai enregistré en PDF.

Après plusieurs essai j'ai réussi à décompresser (Méthode DEFLATE) le texte entre les balises STREAM et ENDSTREAM du PDF.

Entre deux autres balises chaque caractère est numéroté à gauche, sa valeur hexa est noté à droite:
"start"
<01> <0042>
<02> <006F>
<03> <006E>
...
"end"
Impossible de se tromper le code est très bien décompressé !!

Le problème c'est que je n'ai que 25 caractères au lieu des 95 env obtenus précédemment ???

J'ai ajouté une fonction qui transforme les valeurs hexa en décimal, puis en caractères...

La phrase obtenue est : "BonjurCeci stphvbldfPDF."

J'en conclu que le texte est codé...

Est ce que quelqu'un sait pourquoi j'obtiens ce résultat ?
A voir également:

2 réponses

Leam
 
Merci à toutes aides !!
0
Leam
 
Merci à toutes aides !
0