Sortie sed illisible dans emacs
Résolu/Fermé
toshmanbazi
Messages postés
4
Date d'inscription
samedi 14 février 2009
Statut
Membre
Dernière intervention
25 décembre 2009
-
23 déc. 2009 à 18:11
toshmanbazi Messages postés 4 Date d'inscription samedi 14 février 2009 Statut Membre Dernière intervention 25 décembre 2009 - 25 déc. 2009 à 13:47
toshmanbazi Messages postés 4 Date d'inscription samedi 14 février 2009 Statut Membre Dernière intervention 25 décembre 2009 - 25 déc. 2009 à 13:47
A voir également:
- Sortie sed illisible dans emacs
- Word a trouvé du contenu illisible - Guide
- Airpods 3 date de sortie - Guide
- Remettre un pc en sortie d'usine - Guide
- Office 2024 date de sortie - Accueil - Bureautique
- Windows 12 date de sortie - Accueil - Windows
4 réponses
dubcek
Messages postés
18767
Date d'inscription
lundi 15 janvier 2007
Statut
Contributeur
Dernière intervention
5 mars 2025
5 628
24 déc. 2009 à 15:06
24 déc. 2009 à 15:06
hello
en UTF, les caractrères spéciaux sont sur 2 octets
une quesion, veux-tu qu'emacs reconnaisse l'UTF-8, auquel cas : https://rene.seindal.dk/2004/08/07/gnu-emacs-and-utf-8-locale/
ou que le fichier ne soit pas en UTF-8 ?
en UTF, les caractrères spéciaux sont sur 2 octets
$ cat a aaa ééé bbb ààà èèè zzz $ file a a: UTF-8 Unicode text $ od -c a 0000000 a a a \n 303 251 303 251 303 251 \n b b b \n 303 0000020 240 303 240 303 240 \n 303 250 303 250 303 250 \n z z z 0000040 \n 0000041
une quesion, veux-tu qu'emacs reconnaisse l'UTF-8, auquel cas : https://rene.seindal.dk/2004/08/07/gnu-emacs-and-utf-8-locale/
ou que le fichier ne soit pas en UTF-8 ?
toshmanbazi
Messages postés
4
Date d'inscription
samedi 14 février 2009
Statut
Membre
Dernière intervention
25 décembre 2009
24 déc. 2009 à 23:27
24 déc. 2009 à 23:27
Merci dubeck pour ta réponse,
J'ai suivi ta démonstration ainsi que le lien et ça m'a permis de réfléchir le problème autrement. Pour répondre à tes questions, j'aimerai pouvoir revisiter le fichier généré par le script de remplacements et retrouver les accents proprement représentés, or :
En creusant à partir de ta démonstration j'ai relevé les bizarreries suivantes :
Ce que j'en déduis :
- il y a une limite du nombre de lignes au delà de laquelle le script de remplacements archaique ne peut aller sans générer un fichier Non-ISO qui n'est reconnu ni par emacs ni par vim ni par gedit. Seul oowriter tente de rétablir le bon encodage.
Solutions possibles :
- limiter le nombre de lignes de mes fichiers
- améliorer le script de remplacements
Encore merci
J'ai suivi ta démonstration ainsi que le lien et ça m'a permis de réfléchir le problème autrement. Pour répondre à tes questions, j'aimerai pouvoir revisiter le fichier généré par le script de remplacements et retrouver les accents proprement représentés, or :
$ file * a: UTF-8 Unicode C program text, with very long lines c: empty d.sh: a /bin/sed -f script text executable $ wc -l * 930 a 0 c 366 d.sh 1296 total $ head a cmbn à la mz ? crstl 30 à la mz ... pain grillé br... .... $ ./d.sh a>c $ file * a: UTF-8 Unicode C program text, with very long lines c: Non-ISO extended-ASCII C program text, with very long lines, with LF, NEL line terminators d.sh: a /bin/sed -f script text executable $ emacs -nw c ----------------------------------------------------------------------------- Combien \303\240 la maison ? Christ\303\250lle : 30 \303\240 la maison ... pain grill\303\251 beurre... -----------------------------------------------------------------------------
En creusant à partir de ta démonstration j'ai relevé les bizarreries suivantes :
$ >c $ >b $ file * a: UTF-8 Unicode C program text, with very long lines b: empty c: empty d.sh: a /bin/sed -f script text executable $ head a>b $ file * a: UTF-8 Unicode C program text, with very long lines b: UTF-8 Unicode text, with very long lines c: empty d.sh: a /bin/sed -f script text executable $ ./d.sh b>c $ file * a: UTF-8 Unicode C program text, with very long lines b: UTF-8 Unicode text, with very long lines c: UTF-8 Unicode text, with very long lines d.sh: a /bin/sed -f script text executable $ emacs -nw c ----------------------------------------------------------------------------- Combien à la maison ? Christèlle : 30 à la maison ... pain grillé beurre... ----------------------------------------------------------------------------- $ head -728 a>b $ ./d.sh b>c $ file * a: UTF-8 Unicode C program text, with very long lines b: UTF-8 Unicode C program text, with very long lines c: UTF-8 Unicode C program text, with very long lines d.sh: a /bin/sed -f script text executable $ head -729 a>b $ ./d.sh b>c $ file * a: UTF-8 Unicode C program text, with very long lines b: UTF-8 Unicode C program text, with very long lines c: Non-ISO extended-ASCII C program text, with very long lines d.sh: a /bin/sed -f script text executable $ emacs -nw c ----------------------------------------------------------------------------- Combien \303\240 la maison ? Christ\303\250lle : 30 \303\240 la maison ... pain grill\303\251 beurre... -----------------------------------------------------------------------------
Ce que j'en déduis :
- il y a une limite du nombre de lignes au delà de laquelle le script de remplacements archaique ne peut aller sans générer un fichier Non-ISO qui n'est reconnu ni par emacs ni par vim ni par gedit. Seul oowriter tente de rétablir le bon encodage.
Solutions possibles :
- limiter le nombre de lignes de mes fichiers
- améliorer le script de remplacements
Encore merci
dubcek
Messages postés
18767
Date d'inscription
lundi 15 janvier 2007
Statut
Contributeur
Dernière intervention
5 mars 2025
5 628
25 déc. 2009 à 09:42
25 déc. 2009 à 09:42
je dirais que ce n'est pas le nombre de lignes mais la longueur with very long lines, normal si tu tapes au km, normal aussi pour OO writer, puisqu'un traitement de texte va automatiquement insérer les sauts de ligne.
essaye de couper les lignes, brutalement avec la commande fold ou en respectant les mots avec fmt
essaye de couper les lignes, brutalement avec la commande fold ou en respectant les mots avec fmt
toshmanbazi
Messages postés
4
Date d'inscription
samedi 14 février 2009
Statut
Membre
Dernière intervention
25 décembre 2009
25 déc. 2009 à 13:47
25 déc. 2009 à 13:47
Merci dubcek,
J'ai fini par trouver une solution.
Le script de remplacement se terminait par la commande 's/.^/\u&/' que j'ai pêchée sur l'excellente faq de commentçamarche afin de mettre la première lettre de chaque phrase en majuscule.
En remplaçant la séquence '\u' par '\U' le fichier généré est en UTF-8 comme je le souhaitais et je peux donc le réouvrir proprement avec mon éditeur préféré.
Je ne m'explique pas le phénomène, en tout cas notre échange m'a délivré d'une bonne épine et je t'en remercie doublement.
A bientôt
J'ai fini par trouver une solution.
Le script de remplacement se terminait par la commande 's/.^/\u&/' que j'ai pêchée sur l'excellente faq de commentçamarche afin de mettre la première lettre de chaque phrase en majuscule.
En remplaçant la séquence '\u' par '\U' le fichier généré est en UTF-8 comme je le souhaitais et je peux donc le réouvrir proprement avec mon éditeur préféré.
Je ne m'explique pas le phénomène, en tout cas notre échange m'a délivré d'une bonne épine et je t'en remercie doublement.
A bientôt
25 déc. 2009 à 00:21