traitement xml shell script Résolu

Question

Bonjour, J'ai un soucis! J'essaye de traiter un fichier au format xml (balises) sans succès :s Un fichier comporte plusieurs blocs séparer par des balises. Voici le type de bloc: farwarx farwarx1 farwarx2 farwarx2 Mr Farwarx Comment ca marche Je veux avoir comme résultat: farwarx;farwarx1,farwarx2,farwarx3;Mr Farwarx;Comment ca marche J'ai essayé avec sed et grep et paste > problème sur les champs "Other Name". Je tente avec awk et match sans succès!!! Avec de l'aide, on avait presque réussi avec cette commande (sur une CentOs): #awk '{if ($1=="") ligne=""; else if ($1=="") print ligne; else { match($0,/([^<]*)

jipicy · Answer

Salut, jp@MDK:~ ssh$ cat farwarx farwarx farwarx1 farwarx2 farwarx2 Mr Farwarx Comment ca marche jp@MDK:~ ssh$ sed 's/ *<[^>]*>//g' farwarx | sed '/^$/d' | sed ':z;N;$!bz;s/ /;/g' farwarx;farwarx1;farwarx2;farwarx2;Mr Farwarx;Comment ca marche jp@MDK:~ ssh$ ;-))

farwarx · Answer

Je savais que ça serai toi jipicy qui répondrai ;)
J'ai trouvé une solution 'alternative' et non optimisée... mais c'était urgent :S

Ton résultat n'est pas totalement correct:

farwarx;farwarx1;farwarx2;farwarx2;Mr Farwarx;Comment ca marche
farwarx;farwarx1,farwarx2,farwarx2;Mr Farwarx;Comment ca marche

Note les ',' pour les champs identiques.
Il faudrait que je me mette sérieusement sur sed, awk etc...., trop puissant ces outils ;)

Voici ma solution alternative:

#!/bin/bash
while read ligne;
do
  if [ "$ligne" == "<listitem>" ]
  then
    liste=""
  elif [ "$ligne" == "</listitem>" ]
  then
    echo $liste
    Name=""
    Domain=""
    Fullname=""
    Description=""
    MailAddress=""
    ForwardMode=""
    ForwardAddress=""
    Account_enabled=""
  else
    lparse=`echo $ligne |sed -e 's/<variable name="//' -e 's/">.*//'`
    case $lparse in
      Name)
        Name=`echo $ligne |sed -e 's/.*">//' -e 's/<\/variable>//'`
      ;;
      Domain)
        Domain=`echo $ligne |sed -e 's/.*">//' -e 's/<\/variable>//'`
      ;;
      Fullname)
        Fullname=`echo $ligne |sed -e 's/.*">//' -e 's/<\/variable>//'`
      ;;
      Description)
        Description=`echo $ligne |sed -e 's/.*">//' -e 's/<\/variable>//'`
      ;;
      MailAddress)
        MailAddress=$MailAddress","`echo $ligne |sed -e 's/.*">//' -e 's/<\/variable>//'`
      ;;
      ForwardMode)
        ForwardMode=`echo $ligne |sed -e 's/.*">//' -e 's/<\/variable>//'`
      ;;
      ForwardAddress)
        ForwardAddress=`echo $ligne |sed -e 's/.*">//' -e 's/<\/variable>//'`
      ;;
      Account_enabled)
        Account_enabled=`echo $ligne |sed -e 's/.*">//' -e 's/<\/variable>//'`
      ;;
      *)
      ;;
    esac
    liste=$Name";"$Domain";"$Fullname";"$Description";"$MailAddress";"$ForwardMode";"$ForwardAddress";"$Account_enabled
    liste=`echo $liste | sed -e 's/;,/;/'`
  fi
done < $1

J'avais d'autres champs par rapport à l'exemple, mais le principe est le même.
Et je l'exécute avec un fichier en paramètre.
Pas rapide, je te l'accorde, mais il fait ce que je lui demande, faute de savoir sur sed et awk.....
Je sais qu'il est moche, mais qu'en on a plusieurs centaines de blocs, on scripte quoi qu'il arrive ^^

Merci.

jipicy · Answer

[tmpfs]$ cat farwarx farwarx farwarx1 farwarx2 farwarx2 Mr Farwarx Comment ca marche toto toto1 toto2 toto2 toto2 Mr Toto Comment ca marche bien [tmpfs]$ cat test.sed #n \##,\## { /"Name/{ s/ *<[^>]*>//g s/$/%/ h D } :z /r Name/{ s/ *<[^>]*>//g H N D bz } /Fullname/{ s/ *<[^>]*>//g s/^/%/ H D } /Description/{ s/ *<[^>]*>//g s/^/%/ H D } g s/ %\|% /;/g s/ /,/gp s/.*// x d } [tmpfs]$ sed -f test.sed farwarx farwarx;farwarx1,farwarx2,farwarx2;Mr Farwarx;Comment ca marche toto;toto1,toto2,toto2,toto2;Mr Toto;Comment ca marche bien [tmpfs]$ ;-))

farwarx · Answer

J'essaye de comprendre ton fichier test.sed. Est-ce que le #n a une importance? Que signifie exactement \##,\## {? Ensuite j'ai bien compris que lorsque il trouve une occurrence (/"Name"/{, il exécute ce qu'il y a en dessous jusqu'à l'accolade. s: substitution Pour l'occurrence qui se répète on utilise un 'label' (comme un Go To?). :z pour le le début du label bz pour revenir au label z J'ai traduit du man les autres options (H, N, D), mais je n'ai pas tout compris. J'ai l'impression que l'option D permet de passer à la ligne suivante. Pour le H, je dirai qu'il stocke le résultat dans une case d'un tableau temporaire. Pour le N, c'est comme H mais il va mettre la prochaine valeur dans la même case que la précédente. Et au niveau du dernier bloc d'instruction, il se retrouve avec une ligne de résultat, et la tu le parses pour obtenir le résultat désiré. Tu avais rajouté le caractère '%' pour différencier les ';' des ',' et le tour est joué. C'est ça?

Traitement xml shell script

4 réponses

Newsletters