Syntaxe nawk Résolu

Question

Bonjour,


Je dispose d'une commande sympa (récupérée sur CCM) qui permet de faire l'équivalent d'un grep -nombre (lorsque l'option n'est pas dispo dans la distrib). Cette option permet d'avoir le contexte (nombre pour nombre de lignes du contexte) pour un pattern recherché.
Voici la commande en nawk:
nawk 'c-->0;$0~s{if(b)for(c=b+1;c>1;c--)print r[(NR-c+1)%b];print;c=a}b{r[NR%b]=$0}' b=10 a=10 s="pattern" file
équivalent à
grep -10 "pattern" file

Voilà pour l'intro.
De mon côté, ce que je souhaiterai avoir, c'est le paragraphe introduit par une chaîne de caractère particulière et finissant par une autre chaîne de caractère dans lequel il y a le pattern que je cherche.

Exemple:
Je
m'appelle
toto
et
je
suis
gros
Je
m'appelle
titi
et
je
suis
petit

Quelle syntaxe de nawk me donnerait
Je
m'appelle
titi
et
je
suis
si je dis que je recherche "titi" entre "Je" et "suis" ?

Merci de votre aide !

jipicy · Answer

Salut,

Il te faut ça spécialement avec nawk ? (je pense à "sed")

lami20j · Answer

Salut,

(je pense à "sed")

Fini ta pensée ;-)

jipicy · Answer

Ben non, si ce n'est pas la peine (bien que ce soit prêt ;-)) )

unixnewbie · Answer

Je suis open.
Sed, c'est bien :)

jipicy · Answer

Ok.

Sur une ligne ça donne : 

sed -n '/Je/{:z;N;/suis/!bz;/titi/p}' toto

Exemple plus aéré :
jp@MDK:~/tmpfs ssh$ cat toto
Je
m'appelle
toto
et
je
suis
gros
Je
m'appelle
titi
et
je
suis
petit

jp@MDK:~/tmpfs ssh$ sed -n '
/Je/ {
:z
N
/suis/ !b z
/titi/ p
}
' toto
Je
m'appelle
titi
et
je
suis
jp@MDK:~/tmpfs ssh$

unixnewbie · Answer

Merci !

Question bonux: j'ai des slashs dans mes patterns de recherche (c'est du xml). Les escaper ne semble pas marcher. Il faut des guillemets particuliers ?

exemple:
sed -n '/<Chaine1>/{:z;N;/<\/Chaine2>/!bz;/Monpattern/p}' toto

unixnewbie · Answer

En fait, après un test basique, je me rend compte que le pb ne vient pas du backslash mais du label:

sed -n '/Je/{:z;N;/suis/!bz;/titi/p}' titi
Label too long: /Je/{:z;N;/suis/!bz;/titi/p}

Je suis sous Solaris.
Faut que je migre sous linux ? ;-)

unixnewbie · Answer

Comprend pas...

La syntaxe scriptée fonctionne nickel mais pour la ligne de commande, même le "point virgule" avant l'accolade fermante ne résoud pas le pb.

Pourtant une commande comme celle-là passe bien:
sed -n '/Je/,/titi/p' titi

dubcek · Answer

hello 
essayer avec nawk 
$ cat a1 
Je 
m'appelle 
toto 
et 
je 
suis 
gros 
Je 
m'appelle 
titi 
et 
je 
suis 
petit  
$ nawk '{x[NR]=$0}; /Je/ {a=NR}; /titi/ {b=NR}; /suis/ {if(b  > a && b < NR)for(n=a;n<=NR;)print x[n++]}'' a1 
Je 
m'appelle 
titi 
et 
je 
suis 
$

unixnewbie · Answer

Avec un peu de retard (congés, toussa :-) ) : clap clap !

Merci beaucoup. Ca fonctionne nickel !

unixnewbie · Answer

Bonjour,

Je reviens sur cette commande:
La commande décrite ci-dessus fonctionne bien et je voudrais étendre son utilité pour qu'elle soit capable de me donner le même résultat sur plusieurs fichiers.
En faisant le test, si je met un * à la place du fichier, ça marche mais je ne sais pas à quel(s) fichier(s) correspond(ent) les réponses. Ce n'est pas pratique.
A contrario, si je fais un grep -l titi * je n'ai que les noms de fichier.

Peux t'on mixer les deux ?

Exemple de stdout que je voudrais avec une recherche nawk * sur un répertoire contenant 2 fichiers a1 et a2:

a1:
Je 
m'appelle 
titi 
et 
je 
suis 

a2:
Je 
me nomme 
titi 
et 
je 
suis

dubcek · Answer

essaye 
$ nawk 'FNR==1 {print FILENAME ":"}; {x[FNR]=$0}; /Je/ {a=FNR}; /titi/ {b=FNR}; /suis/ {if(b  > a && b < FNR)for(n=a;n<=FNR;)print x[n++]}' a1 a2

unixnewbie · Answer

C'est ce que je disais, ça marche mais je n'ai pas de référence du fichier traité.
Dans ce cas, la réponse est :
Je
m'appelle
titi
et
je
suis
Je
me nomme
titi
et
je
suis

Ce n'est pas très lisible...

Dans mon répertoire de travail, j'ai plusieurs centaines de fichiers sur lesquels je veux lancer ma recherche: 
nawk 'FNR==1 {print FILENAME ":"}; {x[NR]=$0}; /Je/ {a=NR}; /titi/ {b=NR}; /suis/ {if(b  > a && b < NR)for(n=a;n<=NR;)print x[n++]}' *

dubcek · Answer

chez moi, il affiche bien a1: a2: c'est peut-être le nawk Solaris, essaye $ head a3 a4 ==> a3 <== aaa ==> a4 <== bbb $ $ nawk 'FNR==1 {print FILENAME ":"}; {print}' a3 a4 a3: aaa a4: bbb $

unixnewbie · Answer

Oups, je n'avais pas vu le FNR==1 {print FILENAME ":"};
Avec, ça marche. Merci !

Par contre, dans le cas d'une recherche sur plusieurs centaines de fichiers, il me donne le nom de chaque fichier scanné même s'il n' y a pas de correspondance.
Penses-tu qu'il soit possible d'améliorer ce comportement ?

J'ai essayé :
nawk '{x[NR]=$0}; /Je/ {a=NR}; /titi/ {b=NR}; /suis/ {if(b  > a && b < NR)for(n=a;n<=NR;)print FILENAME ":" x[n++]}' *
mais dans ce cas, chaque ligne correspondante est préfixée par le nom de fichier. Pas terrible...

dubcek · Answer

essaye
$ nawk 'FNR==1 {f=1}; {x[FNR]=$0}; /Je/ {a=FNR}; /titi/ {b=FNR}; /suis/ {if(b  > a && b < FNR)for(n=a;n<=FNR;){if(f){print FILENAME ":";f=0}print x[n++]}}' *

unixnewbie · Answer

Je rentre seulement de congés et je me rends compte que j'ai oublié de remercier. Donc un grand merci ! Maintenant, le pb, c'est que ça ne fonctionne pas parfaitement sur mes données. Dans le cas de l'exemple, titi/toto, ça fonctionne parfaitement mais dans le cas de mes données; ça me remonte un peu n'importe quoi sans que j'arrive à établir une corrélation. Dans la vie réelle, j'ai des fichiers XML avec une ou plusieurs commandes symbolisées par des numéros de contrat de type "LULUxxxxxxxxxx" (ou x sont des digits) et les balises et . Voici un exemple:

Lorsque je fais une recherche de ce type: nawk 'FNR==1 {f=1}; {x[FNR]=$0}; // {a=FNR}; /LULUxxxxxxxxxx/ {b=FNR}; /<\/Commande>/ {if(b > a && b < FNR)for(n=a;n<=FNR;){if(f){print FILENAME ":";f=0}print x[n++]}}' * la recherche me remonte n'importe quoi: des fichiers avec les mauvaises commandes, des fichiers avec plusieurs commandes dont celle que je recherche, des fichiers juste avec ma commande (le seul type de résultat que j'attend en fait) Si je fais la même recherche avec l'aide du grep: grep -l LULUxxxxxxxxxx * | xargs nawk 'FNR==1 {f=1}; {x[FNR]=$0}; // {a=FNR}; /LULUxxxxxxxxxx/ {b=FNR}; /<\/Commande>/ {if(b > a && b < FNR)for(n=a;n<=FNR;){if(f){print FILENAME ":";f=0}print x[n++]}}' C'est mieux mais pas encore parfait: je retrouve des fichiers avec plusieurs commandes dont celle que je recherche et des fichiers juste avec ma commande Enfin, cette commande: grep -l LULUxxxxxxxxxx * | xargs nawk '{x[NR]=$0}; // {a=NR}; /LULUxxxxxxxxxx/ {b=NR}; /<\/Commande>/ {if(b > a && b < NR)for(n=a;n<=NR;)print x[n++]}' me remonte les bonnes commandes mais il me manque les noms de fichiers auxquelles ces commandes correspondent. pour l'instant, seule la dernière commande est vraiment fiable mais sans l'info des fichiers, elle ne me sert pas à grand chose. Ouf! Je sais pas si je suis clair... Est-ce que vous pouvez encore m'aider ?

dubcek · Answer

puisqu'on traite plusieurs fichiers, je ne réinitialisais pas les variables, j'ai ajouté a=b=0 au début du traitement de chaque fichier

essaye

nawk 'FNR==1 {f=1;a=b=0}; {x[FNR]=$0}; /<Commande>/ {a=FNR}; /LULU/ {b=FNR}; /<\/Commande>/ {if(b  > a && b < FNR)for(n=a;n<=FNR;){if(f){print FILENAME ":";f=0}print x[n++]}}'  *

unixnewbie · Answer

Génial. Ça marche. Merci dubcek.

Syntaxe nawk

19 réponses

Discussions similaires

Newsletters