Bash-suppression des balises html

Résolu
lily -  
 lily -
Bonjour,


je fais appel à vous car
1) je voudrais supprimer les balises html d'un fichier
2) j'ai donc fais une sortie html de mon fichier mais la mise en forme n'est pas la meme que celle du fichier d'origine, je m'explique : mon fichier est sous forme de liste et en html tout est a la suite séparé par des espaces..

Merci par avance de l'aide que vous voudrez bien m'apporter
A voir également:

3 réponses

zipe31 Messages postés 38797 Statut Contributeur 6 433
 
Salut,

Merci de mettre un exemple de ton fichier ou ici (copier/coller) ou en pièce jointe sur https://www.cjoint.com/ ;-\

Zen my nuggets ;-)
Faites un geste pour l'environnement, fermez vos fenêtres et adoptez un manchot.
0
lily
 
le fichier est sous la forme :
1804 a
1750 class
1364 div
943 http
885 fr
881 n
828 href
503 le
487 du

et en sortie html :
1804 a 1750 class 1364 div 943 http 885 fr 881 n 828 href 503 le 487 du


je voudrais donc que n'apparaissent pas les balises genre class div href ... et que il y ait un saut a la ligne apres chaque mot
0
zipe31 Messages postés 38797 Statut Contributeur 6 433
 
Je doute que ce soit ça que tu veuilles, mais comme j'ai du mal à comprendre ;-\

$ cat brol
1804 a
1750 class
1364 div
943 http
885 fr
881 n
828 href
503 le
487 du

$ sed 'G;s/class\|div\|href\|http//' brol 
1804 a

1750 

1364 

943 

885 fr

881 n

828 

503 le

487 du


$
0
lily
 
non ce n'est pas ce que je veux faire. Je m'explique mieux, en fait mon script doit compter le nombre d'occurrences de chaque mot d'un fichier et le mettre dans un autre nommé par exemple truc.html . mais le problème c'est que ça me compte les balises.
0
zipe31 Messages postés 38797 Statut Contributeur 6 433
 
Je pige rien ;-\

Il est sous quelle forme ton fichier ? Texte ou html ?
0
lily
 
ah non excuse moi le fichier de départ est une page web donc il y a les balises et je voudrais compter les mots sans compter les balises
0
zipe31 Messages postés 38797 Statut Contributeur 6 433
 
Ben alors la solution donnée devrait t'aider à solutionner ton problème ;-)
0
lily
 
Maintenant passons au saut a la ligne. Comment faire que dans ma sortie html les comptes des mots soient sous forme de liste?
0
lily
 
ça y est j'ai trouvé aussi! | awk '{ printf("%s<br/>\n", $0); }'
Un grand Merci a toi pour ton aide zipe31 =)
0