Balises xml dans word 2010
Résolu/Fermémamiemando Messages postés 33410 Date d'inscription jeudi 12 mai 2005 Statut Modérateur Dernière intervention 2 décembre 2024 - 9 sept. 2022 à 08:51
- Balises xml dans word 2010
- Espace insécable word - Guide
- Comment supprimer une page dans word - Guide
- Organigramme word - Guide
- Xml viewer - Télécharger - Édition & Programmation
- Telecharger word 2010 - Télécharger - Traitement de texte
3 réponses
Modifié le 8 sept. 2022 à 10:09
Bonjour,
Ce problème est déjà évoqué dans cette discussion.
Quelques rappels préalables sur le XML
Pour parler en terme simple, le XML est un langage à balises. Il y a deux grands types de balises
- Les balises ouvrantes :
<toto>
- Les balises fermantes :
</toto>
- La portion de texte entre une balise ouvrante et une balise fermante forme un bloc auquel est appliqué ladite balise. Entre les deux, tu peux trouver du texte et/ou d'autres balises, et ainsi de suite récursivement. Comme le montre l'exemple ci-dessous, les balises sont agencées pour respecter le principe des poupées russes : on ne peut pas fermer une balise "enveloppante" (par exemple </aaa>) si des balises enveloppées par ce bloc ne sont pas encore fermée. Dit autrement, on ne peut finir un bloc que si tous les blocs qu'il contient sont fermés.
<aaa> text <bbb> text </bbb> <ccc> <ddd> text </ddd> </ccc> </aaa>
- Il existe un troisième type de balises qui permet d'ouvrir et fermer immédiatement une balises (c'est le cas par exemple de la balise <img> en HTML). Ainsi ces deux syntaxes sont équivalentes :
<img ... />
et :
<img ...></img>
Retour à ton problème
Les fichiers word sont en réalité des fichiers XML compressés. En ce sens ils doivent normalement se conformer à ce principe des poupées russes. Si ça n'est pas le cas, le fichier est mal formé (corrompu) et il n'est pas surprenant que Word ne s'y retrouve pas.
La discussion que j'ai pointé en début de message te montre comment ouvrir un fichier word comment décompresser puis corriger le fichier XML afin de le rendre à nouveau cohérent.
Bonne chance
Modifié le 8 sept. 2022 à 10:10
Bonjour OldDD,
Ton éditeur HTML devrait te permettre de corriger plus facilement le XML de ton fichier word. D'ailleurs le HTML est à peu de chose près un cas particulier de langage XML, au point que part le suite on en a dérivé le XHTML, donc si tu es familier avec le HTML (ce qui semble être le cas vu ton site :p), la logique est la même.
Je ne sais pas si ton éditeur HTML sait indenter du XML écrit sur une ligne de sorte à ce que l'on voit ressortir les blocs comme dans mon message #1 mais si c'est le cas ça t'aiderait sûrement à le corriger. Sinon il va falloir chercher à la main les balises mises en causes dans le message d'erreur et ça risque d'être assez fastidieux.
Certains langages de programmation permettent (au travers le libxml) de récupérer des fichiers XML endommagés, voir par exemple ces deux discussions :
Tu peux aussi essayer de voir si avec un autre logiciel capable de lire des fichiers word (genre libreoffice ou une autre version de word) tu parviens à récupérer ton document (peut-être que ceux-ci intègrent justement une procédure de récupération un peu à l'image des deux discussions précédentes).
Après, il n'est pas dit qu'une de ces solutions marcheraient correctement dans ton cas (et à ta place, je n'essayerais pas avant d'avoir sauvé une copie du document endommagé).
Si tu as besoin de précisions, n'hésite pas à demander, et si tout est clair, tu peux basculer le sujet en résolu.
Bonne chance
8 sept. 2022 à 22:32
Bonsoir mamiemando ! Re-merci pour ces nouvelles précisions ! De fait je me me suis très vite rendu de la difficulté de rechercher la balise fautive, et de la nécessité de faire des copies de sauvegarde. Le document word en question comporte en effet 30 pages regroupant 170 photos légendées ! Mon éditeur HTML (Claris Home Page) étant "out" depuis 2008 pas sûr que cela marche, mais les pistes fournies devraient permettre de me "dépatouiller" Je vais donc clore le sujet en te remerciant à nouveau pour ta gentillesse, et tes compétences. Cordialement et bonne soirée.
9 sept. 2022 à 08:51
Merci pour ces retours très positifs, ça fait plaisir :-) Dans ce cas, je bascule le sujet en résolu.
Bonne continuation !
7 sept. 2022 à 17:22
Bonsoir mamiemando !
Un très grand merci pour la clarté et la promptitude de ta réponse ! Vu ainsi tout paraît simple, ou plus exactement logique.Dans la mesure où ce fichier word (futur pdf), illustrait mes noces de diamant j'étais bien em...bêté !
Bien que pratiquant l'ordi de longue date j'en suis toujours resté à l'éditeur HTLM ( Claris Home Page tourne encore sous windows 10 ! ) d'où un site web "oldschool" datant de l'époque où les sites se construisaient pas à pas, les formules "clés en main" restant à inventer. Fort heureusement le contenu "total perso" (https://www.insectes-net.fr/) tient la route et Google en témoigne.
Encore merci à toi, et à CCM !