[awk] agréger des valeurs de plusieurs lignes sur une seule .... Résolu

Question

Salut,

Je souhaite agréger des valeurs d'un fichier en fonction d'un champ d'identification de groupe. Le fichier final devrait avoir une ligne par groupe et non plus une par enregistrement.

MWE:

    $ head -n4 foo     X;Y;OID;ID;OQTE;QTE;OTYPE;TYPE;Z    603.311;800.928;930;982963;0;XTX;49;comment;191.299    603.512;810.700;930;982963;0;XTX;49;comment;191.341    604.815;802.475;930;982963;0;XTX;49;comment;191.393    601.901;858.701;122;982954;0;XTX;50;comment;194.547    601.851;832.317;122;982954;0;XTX;50;comment;193.733

Ici il  y a deux groupes différents; 982963 and 982954.

Cible souhaitée:

    $ head -n2 bar    CODE;OID;ID;OQTE;QTE;OTYPE;TYPE    "FLW (603.311 800.928 191.299, 603.512 801.700 191.341, 604.815 802.475 191.393)";982963;0;XTX;49;comment    "FLW (601.901 858.701 194.547, 601.851 832.317 193.733)";982954;0;XTX;49;comment
Le champ du groupe est le $4 du fichier foo. 
Les valeurs X Y Z de chaque enregistrement qui constitue un groupe doivent être stockées dans la parenthèse  "FLW ()"; qui elle sera suivie une seule fois des autres valeurs de chaque enregistrement qui sont les mêmes aussi.  L'ordre d'apparition des triplets X Y Z dans la parenthèse doit correspondre à celui des enregistrements du fichier foo; ils doivent se suivre de la même manière qu'ils se suivent dans ce fichier foo. 

Merci.

Pour l'instant j'ai ça mais ça ne fonctionne absolument pas :
awk -F ";" 'NR==1 {print "CODE;"$3";"$4";"$5";"$6";"$7";"$8}; NR>1 {a[$4]=a[$4]}END{for(i in a) { print "\"FLW ("$1","$2","$NF")\";"$3";"i""a[i]";"$5";"$6";"$7";"$8 }}' foo

mamiemando · Answer

Bonjour

Le plus simple à mon avis c'est de lire ton fichier ligne par ligne et peupler un ou des dictionnaires :
https://en.wikibooks.org/wiki/An_Awk_Primer/Arrays

... à partir desquels tu réécriras tes agrégats.

Du coup je t'invite à écrire ton code awk dans un fichier et à l'exécuter via awk -f.

Si tu n'es pas bloqué sur le langage, personnellement je le ferais plutôt en python.

Bonne chance

dubcek · Answer

hello
$ cat a4.awkBEGIN {FS=";"; print "CODE;OID;ID;OQTE;QTE;OTYPE;TYPE"}NR>1 {t[$4]=t[$4] $1 " " $2 " " $9 ", "; t2[$4]=$5 FS $6 FS $7 FS $8}END {for (n in t){sub(", *$", "", t[n]); print "\"FLW (", t[n] ")\"" FS n FS t2[n]}}$ awk -f a4.awk fooCODE;OID;ID;OQTE;QTE;OTYPE;TYPE"FLW ( 601.901 858.701 194.547, 601.851 832.317 193.733)";982954;0;XTX;50;comment"FLW ( 603.311 800.928 191.299, 603.512 810.700 191.341, 604.815 802.475 191.393)";982963;0;XTX;49;comment

[awk] agréger des valeurs de plusieurs lignes sur une seule ....

2 réponses

Discussions similaires

Newsletters