Logiciel d'extraction de mots d'un texte.

Fermé
Nacer - 25 févr. 2010 à 22:40
 Justinet - 22 févr. 2017 à 07:51
Bonjour,

Je suis à la recherche de tout logiciel d'extraction de mots pour confectionner et analyser le vocabulaire d'un texte word (tout corpus saisi sur ordinateur).
Ma recherche sur le web n'a pas été fructueuse.

Bon après-midi.
Amicalement vôtre.
Nacer

7 réponses

sriviere
Messages postés
853
Date d'inscription
jeudi 21 janvier 2010
Statut
Membre
Dernière intervention
2 mai 2013
401
25 févr. 2010 à 22:50
Si vous faites de l'analyse de contenu, le logiciel libre Weft QDA sur ce lien : https://framalibre.org
Cordialement
1
Pour extraire tous les mots d'un texte, j'utilise depuis des années un excellent freeware :
'Textstat' de Lionel Allorge

http://www.lunerouge.org/spip/article.php3?id_article=364

Il dispose d'options qui me sont très utiles :
ignorer ou non les majuscules, ignorer ou non les lettres accentuées, calcule l'écart entre les mots.
0
Bonsoir,

Je ne comprends pas votre demande. En effet, tous les logiciels permettent une recherche par "mots".
Je ne dois pas être le seule à ne pas comprendre, il va falloir restituer votre demande tout public !

Très cordialement,
Migou
0
D'abord merci pour vos contributions.

Pour plus de précisions, mon but est d'extraire d'un texte quelconque tout son vocabulaire afin de l'analyser, lemmatiser ses mots,... Pour faire plus simple, transformer un texte en une colonne de mots.

J'espère vous avoir éclairés.
Encore merci.
Nacer
0
J'ai lu sa demande qui est claire: il s'agit de dresser la liste de tous les mots d'un texte pour en faire un glossaire, par exemple. Il ne s'agit pas d'extraire un mot. Tous les logiciels savent le faire, mais de dresser la liste. Par exemple si Auftrag en allemand apparaît 50 fois dns un texte de 15 pages, on doit pourvoir balayer le texte et faqire figurer une seule fois Auftrag dans le texte et ainsi de suite pour tous les mots importants.
0
Raymond PENTIER
Messages postés
56107
Date d'inscription
lundi 13 août 2007
Statut
Contributeur
Dernière intervention
24 mai 2022
17 209
20 févr. 2011 à 02:45
Migou76, Jean, bonjour.

Nacer ne s'est plus manifesté depuis mars 2010.

Il a fort bien compris que le logiciel qu'il recherchait n'était pas du ressort du forum Bureautique (Word et Writer n'étant absolument pas capables de faire ce genre d'analyse et de lemmatisation)
et il s'est probablement dirigé vers le forum Logiciels/Pilotes ou, mieux, le forum Programmation.

Cordialement.
0
Ouaaaaaaa , pour sriviere,

Je ne m'imaginais même pas que ce genre d'analyse soit possible. Je dois être "trop terre à terre"

Dingue !
0
Bonjour,

Je n'ai pas trouvé "lemmatiser" dans le dictionnaire, mais ce genre d'opération est possible. C'est généralement utilisé pour l'importation de données informatiques dans des outils comme Excel. Je crois que l'on peut également faire certaines manipulations sur des données déjà importées. Dans Open Office vous avez dans l'onglet données une option qui s'appelle texte en colonne qui vous permet ensuite de choisir sur quel séparateur vous désirez travailler. Dans votre cas, il s'agirait de l'espace. Je n'ai plus Excel, mais je crois que ça se trouve également dans l'onglet outil mais s'appelle convertir.

Je vous laisse fouiller dans ce sens,
Cordialement,
Migou
0
Bonjour,

Lemmitiser vient de lemme.
La lemmatisation désigne l'analyse lexicale du contenu d'un texte regroupant les mots d'une même famille. Chacun des mots d'un contenu se trouve ainsi réduit en une entité appelée lemme (forme canonique). La lemmatisation regroupe les différentes formes que peut revêtir un mot, soit : le nom, le pluriel, le verbe à l'infinitif, etc.

Merci de vouloir m'aider.
Souvent j'analyse les contenus des poèmes ou textes. C'est une chose facile quand ceux-là sont courts, mais les longues pièces (un recueil de poésie) deviennent très ardues.

Bonne journée.
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
pdeharbes
Messages postés
186
Date d'inscription
jeudi 11 février 2010
Statut
Membre
Dernière intervention
7 avril 2012
38
26 févr. 2010 à 09:14
Pourquoi ne pas remplacer les blancs (espaces) par "paragraphe suivant" ? Ainsi le texte sera une énorme colonne.
0
Merci de me répondre.
J'aimerais automatiser la tâche pour gagner en temps et me sonsacrer surtout à l'analyse.
En partant d'un texte (ex: word), le résultat doit être une liste de tous les mots du texte; mieux encore si ces derniers sont regroupés par famille de mots (avoir, eu, eusses, ai, avons, auriez,... c'est même famille).
Merci & bonne journée
0
sriviere
Messages postés
853
Date d'inscription
jeudi 21 janvier 2010
Statut
Membre
Dernière intervention
2 mai 2013
401
26 févr. 2010 à 15:59
Nacer,

Essayez le Weft QDA, comme je vous l'ai suggéré plus haut, il fait tout ça.
0
Merci de me répondre.
J'ai installé le Weft QDA mais je n'arrive pas à trouver la manière de convertir un fichier texte.
Pourriez-vous m'aider?
Bonne journée.
0
sriviere
Messages postés
853
Date d'inscription
jeudi 21 janvier 2010
Statut
Membre
Dernière intervention
2 mai 2013
401
3 mars 2010 à 11:24
Bonjour,

Si vous êtes dans Word, vous enregistrez sous "Texte seulement .txt".
0