Traitement html

delta07 -  
toto1983 Messages postés 215 Statut Membre -
Bonjour à vous tous en cette belle matinée

Voila j ai une petite question, evidement sinon je ne serai pas la.

Je dois, pour mon boulot, recuperer des informations contenues dans un pdf.On me demande de les extraire tout dabord en html, puis de les traiter pour pouvoir facilement acceder au données.

Pour etre plus precis, ce sont des tableaux avec des cases, beaucoup de cases.Et lors de la transformation pdf vers html, les données ne sont pas toujours bien "rangées".Pour peu que certaines cases soient margées, c est mort, la conversion decale toutes mes autres cases.

Le but est de pouvoir identifier facilement les données pertinentes, par exemple entre deux balises, et de pouvoir soit les mettre dans une base de donnée, soit en refaire un autre document.

Deux questions donc :

- Existe t il un logiciel qui "pdf to html" vraiment robuste ? ( de preference gratuit, ma boite n aime pas trop payer, mais si vous avez tester des payants je suis tout ouie quand meme)

- Avec quoi puis je traiter mon html ? ( feuille de style ? xml ou autre? je n y connais pas grand chose mais je m y pencherai avec joie pour peu que cela vaille le coup)


Merci de votre aide et de vos conseils

Delta07

6 réponses

delta07
 
une petite idée? une piste ? ....personne ?
0
toto1983 Messages postés 215 Statut Membre 13
 
Essaie avec la classe COM en PHP je sais pas si ça marche avec le pdf mais g déjà exporter du html en format Excel . En fait tu vas être amené probablement à utiliser le VBA pour traiter ton document en PDF
0
delta07
 
merci de ta reponse.

Pourquoi e VBA ? il traite mieux les données et respecte mieux la synthaxe de base ?
0
toto1983 Messages postés 215 Statut Membre 13
 
En fait je n'en suis pas si sur, car lorsque nous cherchons sur Google, aucune trace d'un bout de script pour faire ce que tu demandes, je ne pense pas que la lib COM résolve ton souci.

Honnêtement ton problème recquiert énormément de temps que je ne peux malheureusement te consacrer cependant, un forum tel que www.developpez.net est adapté à ton problème

0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
delta07
 
Ok merci bien, je vais poster la bas.Merci de m avoir accordé un peu de temps et bonne journée^^
0
toto1983 Messages postés 215 Statut Membre 13
 
de rien encore une fois je suis pas sur que tu trouveras un expert en la matière mais comme le dit le dicton
"qui tente rien n'as rien"
0