Compter et détecter des mots

Résolu/Fermé
Swiss Knight - Modifié par Swiss Knight le 15/12/2012 à 16:58
 Swiss Knight - 15 déc. 2012 à 17:33
Bonjour,

je souhaite détecter et compter les mots d'un fichier sans les connaître a priori.

En exemple, pour illustrer ça ; voici le début du contenu d'un tel fichier :
banane 
poire 
carotte  
poire 
poire 
prune 
pêche 
abricot 
pêche 
prune 
céleri 
poire 
poire 
céleri 
...


Je sais qu'avec grep par exemple, nous pouvons trouver le nombre d'occurrence d'un motif.
Mais pour ça il faut connaître ledit motif, or, dans le cas présent, je ne connais pas tous les motifs. J'aimerai donc avoir un résultat qui me liste ces motifs avec le nombre de fois qu'ils apparaissent, par exemple :
banane : 58 
poire : 16 
abricot : 29 
céleri : 4 
...


Et je ne veux pas m'amuser à chercher le nombre de mots différents qui existent dans le fichier ; il comporte plusieurs centaines de milliers de lignes, mais à chaque fois, 1 ligne = 1 mot.

Merci pour les pistes que vous pourriez avoir !


2 réponses

zipe31 Messages postés 36402 Date d'inscription dimanche 7 novembre 2010 Statut Contributeur Dernière intervention 27 janvier 2021 6 415
15 déc. 2012 à 17:09
Salut,

$ cat plop 
banane 
poire 
carotte  
poire 
poire 
prune 
pêche 
abricot 
pêche 
prune 
céleri 
poire 
poire 
céleri

$ sort plop | uniq -c 
      1 abricot
      1 banane
      1 carotte
      2 céleri
      2 pêche
      5 poire
      2 prune

$

1
Swiss Knight
15 déc. 2012 à 17:33
...

je me sens très con là. :D

merci beaucoup !
0