Fichiers identiques mais differents
MrSlave
Messages postés
2657
Statut
Membre
-
MrSlave Messages postés 2657 Statut Membre -
MrSlave Messages postés 2657 Statut Membre -
Bonjour,
J'ai un petit soucis concernant des fichiers xml que j'utilise dans une appli de reporting.
J'utilise des fichiers xml présents dans une ancienne appli, et ceux ci fonctionnent sans problème. Mais si je copie le contenu d'un de ces fichiers, le nouveau fichier pose problème.
Par exemple, si je copie le contenu du fichier "Current_Year.xml" dans un nouveau fichier "test.xml", d'une part la taille ne sera pas la même 177ko contre 89ko pour le nouveau fichier, et de plus, lors d'un XmlDocument.load, le nouveau fichier va planter parce qu'il contient des caractères spéciaux. Ces caractères sont présents dans l'ancien fichier mais ne posent pas de problème.
Le contenu étant exactement identique, j'aurai aimé savoir si quelqu'un savait pourquoi ces fichiers étaient si différents. :/
Je vous remercie.
J'ai un petit soucis concernant des fichiers xml que j'utilise dans une appli de reporting.
J'utilise des fichiers xml présents dans une ancienne appli, et ceux ci fonctionnent sans problème. Mais si je copie le contenu d'un de ces fichiers, le nouveau fichier pose problème.
Par exemple, si je copie le contenu du fichier "Current_Year.xml" dans un nouveau fichier "test.xml", d'une part la taille ne sera pas la même 177ko contre 89ko pour le nouveau fichier, et de plus, lors d'un XmlDocument.load, le nouveau fichier va planter parce qu'il contient des caractères spéciaux. Ces caractères sont présents dans l'ancien fichier mais ne posent pas de problème.
Le contenu étant exactement identique, j'aurai aimé savoir si quelqu'un savait pourquoi ces fichiers étaient si différents. :/
Je vous remercie.
A voir également:
- Fichiers identiques mais differents
- Renommer des fichiers en masse - Guide
- Fichiers epub - Guide
- Explorateur de fichiers - Accueil - Windows
- Wetransfer gratuit fichiers lourd - Guide
- Files : le meilleur explorateur de fichiers pour Windows - Guide
2 réponses
Bonjour,
Tu as typiquement un problème d'encodage.
On peut s'en douter en voyant que la taille du nouveau fichier est deux fois plus petite : les caractères doivent être codés sur un octet, contre deux pour le fichier d'origine.
Si tu utilises Notepad++, tu peux facilement remédier à cela :
Ouvre les deux fichiers. En bas à droite, l'encodage utilisé est affiché (ex. : ANSI, Unicode...)
Il ne te reste qu'à convertir ton nouveau fichier dans le même encodage que l'ancien.
Par exemple, Menu Encodage, option Convertir en ***, et n'oublie pas de le sauvegarder.
Si tu utilises un autre logiciel, soit il a une option similaire, je te laisse la trouver, soit il n'en a pas (comme le bloc-note windows), et il est alors temps de changer de crêmerie ;)
Xavier
PS : l'encodage est la façon dont les textes sont représentés en binaire. Plus l'informatique (et la mémoire disponible) évolue, plus l'encodage utilisé est complexe. Au début, on ne pouvait avoir que les caractères de base, sans accents : c'était l'ASCII, codé sur 7 bits (128 caractères possibles). Au fur et à mesure, on a inclus des caractères plus complexes. En UTF-8, on peut coder du cyrillique, du japonais, du chinois... Il utilise de 1 à 4 octets suivant les caractères à coder.
Tu as typiquement un problème d'encodage.
On peut s'en douter en voyant que la taille du nouveau fichier est deux fois plus petite : les caractères doivent être codés sur un octet, contre deux pour le fichier d'origine.
Si tu utilises Notepad++, tu peux facilement remédier à cela :
Ouvre les deux fichiers. En bas à droite, l'encodage utilisé est affiché (ex. : ANSI, Unicode...)
Il ne te reste qu'à convertir ton nouveau fichier dans le même encodage que l'ancien.
Par exemple, Menu Encodage, option Convertir en ***, et n'oublie pas de le sauvegarder.
Si tu utilises un autre logiciel, soit il a une option similaire, je te laisse la trouver, soit il n'en a pas (comme le bloc-note windows), et il est alors temps de changer de crêmerie ;)
Xavier
PS : l'encodage est la façon dont les textes sont représentés en binaire. Plus l'informatique (et la mémoire disponible) évolue, plus l'encodage utilisé est complexe. Au début, on ne pouvait avoir que les caractères de base, sans accents : c'était l'ASCII, codé sur 7 bits (128 caractères possibles). Au fur et à mesure, on a inclus des caractères plus complexes. En UTF-8, on peut coder du cyrillique, du japonais, du chinois... Il utilise de 1 à 4 octets suivant les caractères à coder.