Recherche d'un mot le plus utilisé
sebprs
-
jipicy Messages postés 40842 Date d'inscription Statut Modérateur Dernière intervention -
jipicy Messages postés 40842 Date d'inscription Statut Modérateur Dernière intervention -
Bonjour,
Je cherche à trouver la suite optimale de commandes du shell bash pour trouver le mot le plus utilisé dans un texte quelconque.
Merci d'avance pour votre aide.
Je cherche à trouver la suite optimale de commandes du shell bash pour trouver le mot le plus utilisé dans un texte quelconque.
Merci d'avance pour votre aide.
Configuration: Windows XP Internet Explorer 8.0
A voir également:
- Recherche d'un mot le plus utilisé
- Trousseau mot de passe iphone - Guide
- Recherche automatique des chaînes ne fonctionne pas - Guide
- Mot de passe bios perdu - Guide
- En n'utilisant que le clavier, quel mot obtenez-vous ? ✓ - Forum Windows
- Comment savoir qui utilise mon wifi et le bloquer - Guide
3 réponses
J'ai déjà commencer à travailler dessus.
en fait la recherche du mot le plus utilisé doit s'effectuer sur un fichier text et non pas un fichier quelconque.
Moi, je pensait supprimer tous les signes de ponctuation et les retours ligne car à deux commandes "tr" et aisi recuerer un fichier texte avec un mot par ligne.
tr -s "\n" < fichier texte > f1
tr -s "[:punct:][:space:]" "\n" < f1 > un_mot_par_ligne
Ensuite, j'effectue un trie du fichier obtenu puis utiliser la commande unique pour ne faire apparaitre que les lignes dupliquées:
sort un_mot_par_ligne | uniqu -d
donc, je me retrouve avec une serie de mots dupliqués, mais comment faire pour retrouver le mot le plus utilisé ?
en fait la recherche du mot le plus utilisé doit s'effectuer sur un fichier text et non pas un fichier quelconque.
Moi, je pensait supprimer tous les signes de ponctuation et les retours ligne car à deux commandes "tr" et aisi recuerer un fichier texte avec un mot par ligne.
tr -s "\n" < fichier texte > f1
tr -s "[:punct:][:space:]" "\n" < f1 > un_mot_par_ligne
Ensuite, j'effectue un trie du fichier obtenu puis utiliser la commande unique pour ne faire apparaitre que les lignes dupliquées:
sort un_mot_par_ligne | uniqu -d
donc, je me retrouve avec une serie de mots dupliqués, mais comment faire pour retrouver le mot le plus utilisé ?
jp@MDK:~/tmpfs ssh$ cat plop
Bonjour,
Je cherche à trouver la suite optimale de commandes du shell bash pour trouver le mot le plus utilisé dans un texte quelconque.
Merci d'avance pour votre aide.
trouver
jp@MDK:~/tmpfs ssh$ for mot in $(cat plop);do echo $mot;done | sort -r | uniq -d -c | head -1
3 trouver
jp@MDK:~/tmpfs ssh$;-))