Récupérer le texte d'un PDF sous DELPHI

Leam -
Leam - 16 nov. 2009 à 23:46

Bonjour,

Je souhaite scanner le texte présent dans les fichiers PDF de mon Disque Dur.

Sous OpenOffice j'ai écris cette phrase :
"Bonjour
Ceci est une phrase pour savoir si je suis capable de la retrouver dans un fichier PDF."

Puis je l'ai enregistré en PDF.

Après plusieurs essai j'ai réussi à décompresser (Méthode DEFLATE) le texte entre les balises STREAM et ENDSTREAM du PDF.

Entre deux autres balises chaque caractère est numéroté à gauche, sa valeur hexa est noté à droite:
"start"
<01> <0042>
<02> <006F>
<03> <006E>
...
"end"
Impossible de se tromper le code est très bien décompressé !!

Le problème c'est que je n'ai que 25 caractères au lieu des 95 env obtenus précédemment ???

J'ai ajouté une fonction qui transforme les valeurs hexa en décimal, puis en caractères...

La phrase obtenue est : "BonjurCeci stphvbldfPDF."

J'en conclu que le texte est codé...

Est ce que quelqu'un sait pourquoi j'obtiens ce résultat ?

Configuration: Windows Vista
Firefox 3.5.5

Afficher la suite

A voir également:

Récupérer le texte d'un PDF sous DELPHI
Delphi 7 - Télécharger - Langages
Texte pdf - Guide
Lire le coran en français pdf - Télécharger - Histoire & Religion
Comment recuperer un message supprimé sur whatsapp - Guide
Récupérer compte yahoo sans numéro de téléphone - Guide

2 réponses

Réponse 1 / 2
Leam

Merci à toutes aides !!
0
Réponse 2 / 2
Leam

Merci à toutes aides !
0

Récupérer le texte d'un PDF sous DELPHI

2 réponses

Discussions similaires

Newsletters