éliminer les mots vide dans un texte (stoplis

hadjir Messages postés 132 Statut Membre -  
hadjir Messages postés 132 Statut Membre -
Bonjour,
j'ai une question :
j'ai un text (chaie de caractére) et je voudrais éliminer les mots vides (3émé etapes de l'indexation "stoplist"), mots vides comme (de, la, que, dans, parce que,.....)
exemple : "éliminer les mots vide dans une chaine de un text"
et je souhaite trouver : "éliminer moes chaine text"
a ce que il ya qlq peut m'aider pour le résoudre.
merci d'avance.

4 réponses

loupius
 
C'est bizarre d'appeler ainsi mots vides, des mots qui ne sont pas... vides !!!
Je n'ai qu'une solution évidente --->>> faire un dictionnaire, car comment dire que des mots comme 'coq', 'cor', 'dé', 'an', 'os', 'pus', 'as', 'axe', 'dû', 'go', 'hue', 'li', 'leu', 'pi', 'rat', 'mie', 'do', 'ré', ne sont pas des mots 'vides ?
Mais tu n'es pas sorti de l'auberge car comment différentier l'article 'un' (que tu définis comme un mot vide) du nombre 'un' (qui n'est pas un mot vide, sinon deux, trois, dix, cent, mille ... le seraient aussi).
Bon courage.
0
hadjir Messages postés 132 Statut Membre
 
Bonjour,
merci pour votre réponse.
on dit mots vides (ou stoplist) dans le cas d'une indexation dans le systeme de recherche d'information.
la liste des mots vides contient aussi (un, deux, trois,.....,le, les,....., de,.....).
pour indexer un text il faut passer par les etapes de processus de recherche d'information, et permet ces etapes on a "éliminer les mots vides".
mais a ce que vous pouvez bizn m'expliquez votre idée svp.
merci d'avance et bon courage.
0
loupius
 
Le dictionnaire ne serait-il pas ce tu appelles 'stop-list'; en clair la liste qui arrête les mots qui n'ont pas d'intérêt ? La solution serait donc dans la question.
0
hadjir Messages postés 132 Statut Membre
 
Bonjour,
merci pour votre réponse.
mais comment faire ça???????????????????????????????????
merci d'avance
0