[SED] substitution
Résolu
cestrade
-
jipicy Messages postés 40842 Date d'inscription Statut Modérateur Dernière intervention -
jipicy Messages postés 40842 Date d'inscription Statut Modérateur Dernière intervention -
Bonjour,
je developpe un petit script qui enleve les commentaires d'un fichier C.
Tout va bien sauf pour les commentaires du type :
/* ======================
blabla
blabla
blabla
=======================*/
Pour les supprimer, j'ai voulu supprimer les sauts de lignes pour pouvoir ensuite enlever ce qui se trouve entre /* et */
Ca donne :
tr '\r\n' '~' |
sed 's/\/\*.*\*\///g' |
tr '~' '\r\n'
Le hic, c'est que le sed en question prend comme balise la 1° occurence de /* et la derniere de */
donc ca ne marche pas pour du code C de la forme
toto=0;
/* ======================
blabla
blabla
blabla
=======================*/
toto=1;
/* comment */
toto=2;
Resultat obtenu :
toto=0;
toto=2;
Quelqu'un sait il comment faire ?
N'hésitez pas si vous avez besoin d'explication supplémentaires!
Merci d'avance,
Christophe
je developpe un petit script qui enleve les commentaires d'un fichier C.
Tout va bien sauf pour les commentaires du type :
/* ======================
blabla
blabla
blabla
=======================*/
Pour les supprimer, j'ai voulu supprimer les sauts de lignes pour pouvoir ensuite enlever ce qui se trouve entre /* et */
Ca donne :
tr '\r\n' '~' |
sed 's/\/\*.*\*\///g' |
tr '~' '\r\n'
Le hic, c'est que le sed en question prend comme balise la 1° occurence de /* et la derniere de */
donc ca ne marche pas pour du code C de la forme
toto=0;
/* ======================
blabla
blabla
blabla
=======================*/
toto=1;
/* comment */
toto=2;
Resultat obtenu :
toto=0;
toto=2;
Quelqu'un sait il comment faire ?
N'hésitez pas si vous avez besoin d'explication supplémentaires!
Merci d'avance,
Christophe
A voir également:
- [SED] substitution
- Remplacez le mot sed par le mot mais dans tout le texte. combien de caractères contient le document suite à cette modification (en incluant les espaces) ? - Guide
- Comptage des caractères dans Word ✓ - Forum Word
- La tentative de récursion de substitution d'image s'annule - Forum Logiciels
- Sed et ses caprices (ou les miens) ✓ - Forum Linux / Unix
- Sed crlf - Astuces et Solutions
9 réponses
Salut,
La 1ère expression enlève les commentaires sur une ligne, la 2nd sur plusieurs lignes :
La 1ère expression enlève les commentaires sur une ligne, la 2nd sur plusieurs lignes :
sed -e 's!/\*.*\*/!!' -e '/\/\*/,/\*\//d';-))
$ cat plop toto=0; /* ====================== blabla blabla blabla =======================*/ toto=0; /* commentaire blabla blabla blabla sur plusieurs lignes */ toto=1; /* comment */ toto=2; $ sed -e 's!/\*.*\*/!!' -e '/;[ ]*\/\*/{:z; N; s!/\*.*\*/!!;Tz}' -e'/\/\*/,/\*\//d' plop toto=0; toto=0; toto=1; toto=2;;-))
Avec ça ça devrait le faire à tous les coups :
;-))
sed -e 's!/\*.*\*/!!' -e '/.*\/\*/{:z; N; s!/\*.*\*/!!;Tz}' -e'/\/\*/,/\*\//d' plopPour les explications, ce soir quand je rentre...
;-))
Voilà les explications des différentes parties juste pour la forme, parce qu'avec les nouvelles directives, la simple expression :
En fait on recherche un motif correspondant à "/*bla ... bla... bla ... */" d'abord sur une ligne entière (les délimiteurs commençant et finissant la ligne), puis on examine le cas ou le 1er délimiteur ne serait pas le 1 er caractère sur la ligne et que le délimiteur de fin ne serait pas sur la même ligne. En dernier lieu vient le cas où les commentaires sont sur plusieurs ligne avec un délimiteur de départ en début de ligne...
PS. le motif :
un motif ne commençant pas en début de ligne, après un point virgule suivi éventuellement d'un (ou plusieurs) espace(s)...
;-))
sed -e '/.*\/\*/{:z; N; s!/\*.*\*/!!;Tz}'suffit pour tous les cas ;-))
En fait on recherche un motif correspondant à "/*bla ... bla... bla ... */" d'abord sur une ligne entière (les délimiteurs commençant et finissant la ligne), puis on examine le cas ou le 1er délimiteur ne serait pas le 1 er caractère sur la ligne et que le délimiteur de fin ne serait pas sur la même ligne. En dernier lieu vient le cas où les commentaires sont sur plusieurs ligne avec un délimiteur de départ en début de ligne...
s!/\*.*\*/!! # sur une ligne on supprime tout /.*\/\*/ { # sur plusieurs lignes ( matche aussi le cas sur un seule ligne) mais ne commençant pas en début de ligne. Si une ligne comprenant le motif est trouvée on enchaine les commandes se trouvant entre accolades :z # définition d'une étiquette pour boucler N # donc si un motif est trouvé, on ajoute la ligne suivante dans l'espace de travail s!/\*.*\*/!! # on supprime tout entre /* et */ si le motif est présent T z # on teste si une substitution a eu lieu au cas ou le motif serait présent dans l'espace de travail. Dans le cas contraire on boucle en se branchant à l'étiquette et ainsi de suite jusqu'à ce qu'une substitution ait lieu, ce qui aura pour effet de lancer la commande qui suit l'accolade fermante } /\/\*/,/\*\// d #si un motif correspondant se situe sur plusieurs lignes, on efface toutes les lignes de cet intervalle
PS. le motif :
/;*[ ]*\/\*/correspondait à :
un motif ne commençant pas en début de ligne, après un point virgule suivi éventuellement d'un (ou plusieurs) espace(s)...
;-))
Vous n’avez pas trouvé la réponse que vous recherchez ?
Posez votre question
une fois de plus, merci jicipy !
la 1° expression, je l'avais, par contre la 2° marche bien sauf ds le cas suivant :
toto=0; /* commentaire
sur plusieurs lignes */
c'est pour ca que je pensais faire la methode ci dessus en supprimant les sauts de lignes, pour avoir tous les commentaires sur une ligne...
une autre idée ?
la 1° expression, je l'avais, par contre la 2° marche bien sauf ds le cas suivant :
toto=0; /* commentaire
sur plusieurs lignes */
c'est pour ca que je pensais faire la methode ci dessus en supprimant les sauts de lignes, pour avoir tous les commentaires sur une ligne...
une autre idée ?
Merci encore !
J'admet qu'on approche de la perfection, mais j'ai encore trouvé un cas où ca ne marche pas... :
#define ONE 1 /* ceci est un commentaire sur
plusieurs lignes */
C'est vrai je suis vicieux là, mais vu que j'ai du mal à comprendre le "-e '/;[ ]*\/\*/{:z; N; s!/\*.*\*/!!;Tz}'" ...
A+
Christophe
J'admet qu'on approche de la perfection, mais j'ai encore trouvé un cas où ca ne marche pas... :
#define ONE 1 /* ceci est un commentaire sur
plusieurs lignes */
C'est vrai je suis vicieux là, mais vu que j'ai du mal à comprendre le "-e '/;[ ]*\/\*/{:z; N; s!/\*.*\*/!!;Tz}'" ...
A+
Christophe
merci !! Ca m'a l'air de bien marcher !!
pour ceux que ca interesse, le filtre qui supprime donc les commentaires dans un fichier C, qu'ils soient de type /* comment */ , // comment , sur une ou plusieurs lignes .... :
sed -e 's!/\*.*\*/!!
/.*\/\*/{:z; N; s!/\*.*\*/!!;Tz}
s/\/\/.*//g
/\/\*/,/\*\//d
'
pour ceux que ca interesse, le filtre qui supprime donc les commentaires dans un fichier C, qu'ils soient de type /* comment */ , // comment , sur une ou plusieurs lignes .... :
sed -e 's!/\*.*\*/!!
/.*\/\*/{:z; N; s!/\*.*\*/!!;Tz}
s/\/\/.*//g
/\/\*/,/\*\//d
'
Allez un ch'tit dernier pour la route et pour que ce soit bien propre (le dernier laisser plein de lignes vides inutiles).
Le fichier de départ :
Le fichier de départ :
$ cat plop toto=0; /* ====================== blabla blabla blabla =======================*/ toto=1; /* commentaire blabla blabla blabla sur plusieurs lignes */ #define ONE 1 /* ceci est un commentaire sur plusieurs lignes */ toto=2; /* comment */ toto=3;La version sale :
$ sed -e '/.*\/\*/{:z; N; s!/\*.*\*/!!;Tz}' plop toto=0; toto=1; #define ONE 1 toto=2; toto=3;Et la version proprette :
$ sed -e '/.*\/\*/{:z; N; s!/\*.*\*/!!;Tz; /^$/{N;/^\n$/d}}' plop toto=0; toto=1; #define ONE 1 toto=2; toto=3;;-))