Traitement html
delta07
-
toto1983 Messages postés 215 Statut Membre -
toto1983 Messages postés 215 Statut Membre -
Bonjour à vous tous en cette belle matinée
Voila j ai une petite question, evidement sinon je ne serai pas la.
Je dois, pour mon boulot, recuperer des informations contenues dans un pdf.On me demande de les extraire tout dabord en html, puis de les traiter pour pouvoir facilement acceder au données.
Pour etre plus precis, ce sont des tableaux avec des cases, beaucoup de cases.Et lors de la transformation pdf vers html, les données ne sont pas toujours bien "rangées".Pour peu que certaines cases soient margées, c est mort, la conversion decale toutes mes autres cases.
Le but est de pouvoir identifier facilement les données pertinentes, par exemple entre deux balises, et de pouvoir soit les mettre dans une base de donnée, soit en refaire un autre document.
Deux questions donc :
- Existe t il un logiciel qui "pdf to html" vraiment robuste ? ( de preference gratuit, ma boite n aime pas trop payer, mais si vous avez tester des payants je suis tout ouie quand meme)
- Avec quoi puis je traiter mon html ? ( feuille de style ? xml ou autre? je n y connais pas grand chose mais je m y pencherai avec joie pour peu que cela vaille le coup)
Merci de votre aide et de vos conseils
Delta07
Voila j ai une petite question, evidement sinon je ne serai pas la.
Je dois, pour mon boulot, recuperer des informations contenues dans un pdf.On me demande de les extraire tout dabord en html, puis de les traiter pour pouvoir facilement acceder au données.
Pour etre plus precis, ce sont des tableaux avec des cases, beaucoup de cases.Et lors de la transformation pdf vers html, les données ne sont pas toujours bien "rangées".Pour peu que certaines cases soient margées, c est mort, la conversion decale toutes mes autres cases.
Le but est de pouvoir identifier facilement les données pertinentes, par exemple entre deux balises, et de pouvoir soit les mettre dans une base de donnée, soit en refaire un autre document.
Deux questions donc :
- Existe t il un logiciel qui "pdf to html" vraiment robuste ? ( de preference gratuit, ma boite n aime pas trop payer, mais si vous avez tester des payants je suis tout ouie quand meme)
- Avec quoi puis je traiter mon html ? ( feuille de style ? xml ou autre? je n y connais pas grand chose mais je m y pencherai avec joie pour peu que cela vaille le coup)
Merci de votre aide et de vos conseils
Delta07
A voir également:
- Traitement html
- Reconsidérer le traitement de vos informations à des fins publicitaires - Accueil - Réseaux sociaux
- Editeur html - Télécharger - HTML
- Traitement de texte gratuit - Guide
- Ce logiciel gratuit et léger est parfait pour remplacer Word, même sur un vieux PC - Guide
- Traitement de texte gratuit open office - Télécharger - Suite bureautique
6 réponses
Essaie avec la classe COM en PHP je sais pas si ça marche avec le pdf mais g déjà exporter du html en format Excel . En fait tu vas être amené probablement à utiliser le VBA pour traiter ton document en PDF
merci de ta reponse.
Pourquoi e VBA ? il traite mieux les données et respecte mieux la synthaxe de base ?
Pourquoi e VBA ? il traite mieux les données et respecte mieux la synthaxe de base ?
En fait je n'en suis pas si sur, car lorsque nous cherchons sur Google, aucune trace d'un bout de script pour faire ce que tu demandes, je ne pense pas que la lib COM résolve ton souci.
Honnêtement ton problème recquiert énormément de temps que je ne peux malheureusement te consacrer cependant, un forum tel que www.developpez.net est adapté à ton problème
Honnêtement ton problème recquiert énormément de temps que je ne peux malheureusement te consacrer cependant, un forum tel que www.developpez.net est adapté à ton problème
Vous n’avez pas trouvé la réponse que vous recherchez ?
Posez votre question