Logiciel d'extraction de mots d'un texte.

Nacer -  
 Justinet -
Bonjour,

Je suis à la recherche de tout logiciel d'extraction de mots pour confectionner et analyser le vocabulaire d'un texte word (tout corpus saisi sur ordinateur).
Ma recherche sur le web n'a pas été fructueuse.

Bon après-midi.
Amicalement vôtre.
Nacer
A voir également:

7 réponses

sriviere Messages postés 853 Date d'inscription   Statut Membre Dernière intervention   410
 
Si vous faites de l'analyse de contenu, le logiciel libre Weft QDA sur ce lien : https://framalibre.org
Cordialement
1
Justinet
 
Pour extraire tous les mots d'un texte, j'utilise depuis des années un excellent freeware :
'Textstat' de Lionel Allorge

http://www.lunerouge.org/spip/article.php3?id_article=364

Il dispose d'options qui me sont très utiles :
ignorer ou non les majuscules, ignorer ou non les lettres accentuées, calcule l'écart entre les mots.
0
Migou76
 
Ouaaaaaaa , pour sriviere,

Je ne m'imaginais même pas que ce genre d'analyse soit possible. Je dois être "trop terre à terre"

Dingue !
0
Migou76
 
Bonjour,

Je n'ai pas trouvé "lemmatiser" dans le dictionnaire, mais ce genre d'opération est possible. C'est généralement utilisé pour l'importation de données informatiques dans des outils comme Excel. Je crois que l'on peut également faire certaines manipulations sur des données déjà importées. Dans Open Office vous avez dans l'onglet données une option qui s'appelle texte en colonne qui vous permet ensuite de choisir sur quel séparateur vous désirez travailler. Dans votre cas, il s'agirait de l'espace. Je n'ai plus Excel, mais je crois que ça se trouve également dans l'onglet outil mais s'appelle convertir.

Je vous laisse fouiller dans ce sens,
Cordialement,
Migou
0
Nacer
 
Bonjour,

Lemmitiser vient de lemme.
La lemmatisation désigne l'analyse lexicale du contenu d'un texte regroupant les mots d'une même famille. Chacun des mots d'un contenu se trouve ainsi réduit en une entité appelée lemme (forme canonique). La lemmatisation regroupe les différentes formes que peut revêtir un mot, soit : le nom, le pluriel, le verbe à l'infinitif, etc.

Merci de vouloir m'aider.
Souvent j'analyse les contenus des poèmes ou textes. C'est une chose facile quand ceux-là sont courts, mais les longues pièces (un recueil de poésie) deviennent très ardues.

Bonne journée.
0
pdeharbes Messages postés 192 Date d'inscription   Statut Membre Dernière intervention   31
 
Pourquoi ne pas remplacer les blancs (espaces) par "paragraphe suivant" ? Ainsi le texte sera une énorme colonne.
0
Nacer
 
Merci de me répondre.
J'aimerais automatiser la tâche pour gagner en temps et me sonsacrer surtout à l'analyse.
En partant d'un texte (ex: word), le résultat doit être une liste de tous les mots du texte; mieux encore si ces derniers sont regroupés par famille de mots (avoir, eu, eusses, ai, avons, auriez,... c'est même famille).
Merci & bonne journée
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
sriviere Messages postés 853 Date d'inscription   Statut Membre Dernière intervention   410
 
Nacer,

Essayez le Weft QDA, comme je vous l'ai suggéré plus haut, il fait tout ça.
0
Nacer
 
Merci de me répondre.
J'ai installé le Weft QDA mais je n'arrive pas à trouver la manière de convertir un fichier texte.
Pourriez-vous m'aider?
Bonne journée.
0
sriviere Messages postés 853 Date d'inscription   Statut Membre Dernière intervention   410
 
Bonjour,

Si vous êtes dans Word, vous enregistrez sous "Texte seulement .txt".
0
Migou76
 
Bonsoir,

Je ne comprends pas votre demande. En effet, tous les logiciels permettent une recherche par "mots".
Je ne dois pas être le seule à ne pas comprendre, il va falloir restituer votre demande tout public !

Très cordialement,
Migou
-1
Nacer
 
D'abord merci pour vos contributions.

Pour plus de précisions, mon but est d'extraire d'un texte quelconque tout son vocabulaire afin de l'analyser, lemmatiser ses mots,... Pour faire plus simple, transformer un texte en une colonne de mots.

J'espère vous avoir éclairés.
Encore merci.
Nacer
0
Jean
 
J'ai lu sa demande qui est claire: il s'agit de dresser la liste de tous les mots d'un texte pour en faire un glossaire, par exemple. Il ne s'agit pas d'extraire un mot. Tous les logiciels savent le faire, mais de dresser la liste. Par exemple si Auftrag en allemand apparaît 50 fois dns un texte de 15 pages, on doit pourvoir balayer le texte et faqire figurer une seule fois Auftrag dans le texte et ainsi de suite pour tous les mots importants.
0
Raymond PENTIER Messages postés 58993 Date d'inscription   Statut Contributeur Dernière intervention   17 366
 
Migou76, Jean, bonjour.

Nacer ne s'est plus manifesté depuis mars 2010.

Il a fort bien compris que le logiciel qu'il recherchait n'était pas du ressort du forum Bureautique (Word et Writer n'étant absolument pas capables de faire ce genre d'analyse et de lemmatisation)
et il s'est probablement dirigé vers le forum Logiciels/Pilotes ou, mieux, le forum Programmation.

Cordialement.
0