Texte: Suppression des doubons et occurence

Résolu
Vetruve Messages postés 10 Date d'inscription   Statut Membre Dernière intervention   -  
Vetruve Messages postés 10 Date d'inscription   Statut Membre Dernière intervention   -
Bonjour,

Je souhaiterais trouver un logiciel si possibible open source qui a partir d'un fichier texte créer la liste des mots utilisés en supprimant les doublons et en donnant eventuellement l'occurence de chaque mot dans le texte.

Merci
A voir également:

5 réponses

BloodyAngel Messages postés 1482 Date d'inscription   Statut Contributeur Dernière intervention   403
 
Hello
bah je te le fais si tu veux... tu me donnes combien ? ^^
0
Vetruve Messages postés 10 Date d'inscription   Statut Membre Dernière intervention  
 
Ok, à 20 Euros de l'heure ca me coute combien ?
0
BloodyAngel Messages postés 1482 Date d'inscription   Statut Contributeur Dernière intervention   403 > Vetruve Messages postés 10 Date d'inscription   Statut Membre Dernière intervention  
 
Bin vu que ça me prendra environs 20 minutes, ça devrait faire +/-5€ ^^
Dans une base de données Access ça te va ?
Sinon je le fais en C# mais il te faut le framework (si ton pc est ok avec les maj windows ça devrait pas poser de soucis).
0
Vetruve Messages postés 10 Date d'inscription   Statut Membre Dernière intervention   > BloodyAngel Messages postés 1482 Date d'inscription   Statut Contributeur Dernière intervention  
 
Non, je préfererai un executable autonome avec un programme ou tu lui rentre le fichier en entrée.
Lorsque tu execute l'application "occurence", le fichier de sortie s'enregistrera au même endroit avec pour nom "nomdufichier-occurence"

A la fin je souhaiterai pourvoir ouvrir le fichier dans excel avec dans la première colonne, les mots triés par ordre alpha et en deuxième colonne le nombre d'occurence.

Option filtrage: pouvoir donner en entrée des mots qu'il faut éliminer (exemple: le, de, je, tu,...).
0
Vetruve Messages postés 10 Date d'inscription   Statut Membre Dernière intervention  
 
Mon premier besoins est de compter les mots.

Mon deuxième besoin est compter les termes:

Exemple: "Les T-Labs sont un centre de recherche où informaiciens et linguistes travaillent pour enseigner aux ordinateurs à s'exprimer comme des être humains."

Je souhaiterai avoir comme résultat

* Centre de recherche, 1
* informaticiens, 1
* linguiste, 1
* enseigner aux ordinateurs, 1
* s'exprimer comme des êtres humains, 1
0
BloodyAngel Messages postés 1482 Date d'inscription   Statut Contributeur Dernière intervention   403
 
oki...
ce que je te propose, c'est qu'un formulaire te permette d'entrer les mots ou morceaux de phrases recherchées (avec des options comme prise en compte des majuscules, etc.). Ensuite un bouton te permet de lancer l'analyse et tu obtiens le résultat...
0
Vetruve Messages postés 10 Date d'inscription   Statut Membre Dernière intervention  
 
Non je pense que la deuxième partie est trop complexe car je souhaiterai une analyse automatique. Pour ce deuxième besoin je pense qu'il me faudra un vrai logiciel prevu pour cela. https://translatedlabs.com/bienvenue?l=fr

Sinon pour le premier besoin je t'ai repréciser ma demande. On en reparle demain !?

A+
0
Vetruve Messages postés 10 Date d'inscription   Statut Membre Dernière intervention  
 
Je crois que j'ai trouvé mon bonheur ici. http://neon.niederlandistik.fu-berlin.de/textstat/
merci
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
Vetruve Messages postés 10 Date d'inscription   Statut Membre Dernière intervention  
 
Encore un autre Textstat http://www.lunerouge.org/spip/article.php3?id_article=364
Celui-ci est plus orienté sur les statistiques mais il calcul aussi la fréquence des mots. Il est en français, et plus simple d'utilisation que l'autre. Il n'est par contre pas possible d'ajouter plusieurs fichier à l'analyse contrairement a l'autre.
0