Convertion html > xml

alainbrest Messages postés 593 Date d'inscription   Statut Membre Dernière intervention   -  
avion-f16 Messages postés 19252 Date d'inscription   Statut Contributeur Dernière intervention   -
Bonjour à tous et bonne année ,

voilà , j'ai téléchargé un fichier html dont je voudrai faire une base de données xml pour un logiciel de gestion de chants .

comme je suis nullissime en programmation , je me suis dit que j'allais voir sur le net .
j'ai trouvé tidy qui ne marche que sous windows (je suis sous linux ubuntu 10.04) et encore deux ou trois autres programmes du meme topeau voire , en plus , payants .

voilà , en somme , je sèche . vous pourriez me trouver ça ? un logiciel ou, de manière plus générale , un programme qui fasse la conversion html>>>xml ?

merci
a votre disposition pour plus de renseignements si besoin ...

j'ai cherché des logiciels de conversion html>>>xml , mais ils ne sont pas légion ,
mème sous ubuntu .
citons par exemple : bluefish , geany , seamonkey , quanta plus (ne fonctionne pas) , scratch (pour les enfants) , KXSLDbg (xml>>>html mais pas l'inverse !)

et pour windows entre autres "tidy"

là, je sèche ...

par ailleurs que veut dire la ligne suivante : (j'espère qu'elle ne bloque pas la traduction en xml)

<html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns="http://www.w3.org/TR/REC-html40/">

qqun sait il ce qu'est "PO4A" et comment s'en servir dans le cas qui m'occupe ?


A voir également:

3 réponses

avion-f16 Messages postés 19252 Date d'inscription   Statut Contributeur Dernière intervention   4 507
 
Salut.

Tu ne peux pas convertir du HTML en XML.
Le HTML est déjà une forme de XML, mais avec des règles.

Le code HTML de ta page Web ne respecte surement pas une structure, donc il va falloir le transformer à la main.

Surtout que transformer du HTML en XML sans connaître la structure du XML qui doit en résulter, ça va être difficile.
0
alainbrest Messages postés 593 Date d'inscription   Statut Membre Dernière intervention   10
 
si si , ça existe , pour preuve : tidy (pour windows)
0
avion-f16 Messages postés 19252 Date d'inscription   Statut Contributeur Dernière intervention   4 507
 
Tidy HTML sert à corriger le code HTML d'une page Web pour qu'il soit valide selon les standards du W3C.

Même si un logiciel de la sorte existait, il faudrait indiquer la structure du HTML et la structure de sortie en XML. Et comme je l'ai déjà dit, le HTML ne suis pas obligatoirement une logique, donc ça doit être fait manuellement.
0