Fichiers identiques mais differents

Question

Bonjour, 

J'ai un petit soucis concernant des fichiers xml que j'utilise dans une appli de reporting.
J'utilise des fichiers xml présents dans une ancienne appli, et ceux ci fonctionnent sans problème. Mais si je copie le contenu d'un de ces fichiers, le nouveau fichier pose problème.

Par exemple, si je copie le contenu du fichier "Current_Year.xml" dans un nouveau fichier "test.xml", d'une part la taille ne sera pas la même 177ko contre 89ko pour le nouveau fichier, et de plus, lors d'un XmlDocument.load, le nouveau fichier va planter parce qu'il contient des caractères spéciaux. Ces caractères sont présents dans l'ancien fichier mais ne posent pas de problème. 

Le contenu étant exactement identique, j'aurai aimé savoir si quelqu'un savait pourquoi ces fichiers étaient si différents.  :/

Je vous remercie.

Reivax962 · Answer

Bonjour,  

Tu as typiquement un problème d'encodage.  
On peut s'en douter en voyant que la taille du nouveau fichier est deux fois plus petite : les caractères doivent être codés sur un octet, contre deux pour le fichier d'origine.  

Si tu utilises Notepad++, tu peux facilement remédier à cela :  
Ouvre les deux fichiers. En bas à droite, l'encodage utilisé est affiché (ex. : ANSI, Unicode...)  
Il ne te reste qu'à convertir ton nouveau fichier dans le même encodage que l'ancien.  
Par exemple, Menu Encodage, option Convertir en ***, et n'oublie pas de le sauvegarder.  

Si tu utilises un autre logiciel, soit il a une option similaire, je te laisse la trouver, soit il n'en a pas (comme le bloc-note windows), et il est alors temps de changer de crêmerie ;)  

Xavier  

PS : l'encodage est la façon dont les textes sont représentés en binaire. Plus l'informatique (et la mémoire disponible) évolue, plus l'encodage utilisé est complexe. Au début, on ne pouvait avoir que les caractères de base, sans accents : c'était l'ASCII, codé sur 7 bits (128 caractères possibles). Au fur et à mesure, on a inclus des caractères plus complexes. En UTF-8, on peut coder du cyrillique, du japonais, du chinois... Il utilise de 1 à 4 octets suivant les caractères à coder.

MrSlave · Answer

Raaa, mais quel con.  >.<

Je te remercie, c'était tout à fait ça.  :)
J'ai tout mis en Unicode, pis plus de problème.
J'utilise conTEXT, donc pas de soucis, il y a bien l'option pour changer. ^^

Fichiers identiques mais differents

2 réponses

Discussions similaires

Newsletters