Compter et détecter des mots

Résolu
Swiss Knight -  
 Swiss Knight -
Bonjour,

je souhaite détecter et compter les mots d'un fichier sans les connaître a priori.

En exemple, pour illustrer ça ; voici le début du contenu d'un tel fichier :
banane 
poire 
carotte  
poire 
poire 
prune 
pêche 
abricot 
pêche 
prune 
céleri 
poire 
poire 
céleri 
...


Je sais qu'avec grep par exemple, nous pouvons trouver le nombre d'occurrence d'un motif.
Mais pour ça il faut connaître ledit motif, or, dans le cas présent, je ne connais pas tous les motifs. J'aimerai donc avoir un résultat qui me liste ces motifs avec le nombre de fois qu'ils apparaissent, par exemple :
banane : 58 
poire : 16 
abricot : 29 
céleri : 4 
...


Et je ne veux pas m'amuser à chercher le nombre de mots différents qui existent dans le fichier ; il comporte plusieurs centaines de milliers de lignes, mais à chaque fois, 1 ligne = 1 mot.

Merci pour les pistes que vous pourriez avoir !

2 réponses

  1. zipe31 Messages postés 34620 Date d'inscription   Statut Contributeur Dernière intervention   6 501
     
    Salut,

    $ cat plop 
    banane 
    poire 
    carotte  
    poire 
    poire 
    prune 
    pêche 
    abricot 
    pêche 
    prune 
    céleri 
    poire 
    poire 
    céleri
    
    $ sort plop | uniq -c 
          1 abricot
          1 banane
          1 carotte
          2 céleri
          2 pêche
          5 poire
          2 prune
    
    $

    1
  2. Swiss Knight
     
    ...

    je me sens très con là. :D

    merci beaucoup !
    0