Liste des mots français & les traits morphos
Résolu
caroline
-
caroline -
caroline -
A voir également:
- Fichier liste mots français
- Lire le coran en français pdf - Télécharger - Histoire & Religion
- Fichier bin - Guide
- Liste déroulante excel - Guide
- Fichier epub - Guide
- Fichier rar - Guide
4 réponses
Moi j'utilise régulièrement Lexique3.
Certes il n'est pas complet, mais il a l'avantage d'exister !
Voici la légende correspondant aux informations qu'il contient pour chaque mot :
Certes il n'est pas complet, mais il a l'avantage d'exister !
Voici la légende correspondant aux informations qu'il contient pour chaque mot :
1_ortho 2_phon 3_lemme 4_cgram 5_genre 6_nombre 7_freqlemfilms2 8_freqlemlivres 9_freqfilms2 10_freqlivres 11_infover 12_nbhomogr 13_nbhomoph 14_islem 15_nblettres 16_nbphons 17_cvcv 18_p_cvcv 19_voisorth 20_voisphon 21_puorth 22_puphon 23_syll 24_nbsyll 25_cv-cv 26_orthrenv 27_phonrenv 28_orthosyll 29_cgramortho 30_deflem 31_defobs 32_old20 33_pld20 34_morphoder 35_nbmorph
En fait, c'est que tu demandais un fichier au format .txt
Or les fichiers textes sont très basiques, c'est leur principal avantage mais aussi leur principal inconvénient.
En fait le "tableau" existe puisqu'on a entre chaque "colonne" une tabulation \t, et entre chaque "ligne" un saut de ligne \n.
Mais un "vrai tableau" comme tu le penses serait très compliqué au format texte, puisqu'il faut mettre des mots très courts ("à" par exemple) et très long ("anticonstitutionnellement"), il faudrait donc rajouter des espaces pour tout aligner.
Si tu veux "voir" un vrai tableau, tu peux faire copier-coller tout le fichier dans un tableur (Microsoft Excel, Open Office Math...), les lignes et les colonnes seront toutes à la bonne place.
Ou alors plus simple : télécharger directement la version Excel, mais ce n'est plus un format .txt
Or les fichiers textes sont très basiques, c'est leur principal avantage mais aussi leur principal inconvénient.
En fait le "tableau" existe puisqu'on a entre chaque "colonne" une tabulation \t, et entre chaque "ligne" un saut de ligne \n.
Mais un "vrai tableau" comme tu le penses serait très compliqué au format texte, puisqu'il faut mettre des mots très courts ("à" par exemple) et très long ("anticonstitutionnellement"), il faudrait donc rajouter des espaces pour tout aligner.
Si tu veux "voir" un vrai tableau, tu peux faire copier-coller tout le fichier dans un tableur (Microsoft Excel, Open Office Math...), les lignes et les colonnes seront toutes à la bonne place.
Ou alors plus simple : télécharger directement la version Excel, mais ce n'est plus un format .txt
Qu'est-ce que tu ne trouves pas ?
Exemple : livre
Ici on voit que pour le nom, on ne précise pas le genre, mais c'est qu'en fait les deux sont acceptables, on dit aussi bien "un livre" que "une livre" même si ça ne correspond pas à la même chose.
La deuxième ligne concerne quant à elle le verbe livrer, à la 1è, 2è ou 3è personne du singulier, selon les différents temps.
catégorie: nom / type : nom_commun : colonne 4_cgram nombre : singulier : colonne 6_nombre (s ou p) genre : masculin : colonne 5_genre (m ou f) personne: 3eme : colonne 11_infover
Exemple : livre
livre livR livre NOM ... livre livR livrer VER ... imp:pre:2s;ind:pre:1s;ind:pre:3s;sub:pre:3s;
Ici on voit que pour le nom, on ne précise pas le genre, mais c'est qu'en fait les deux sont acceptables, on dit aussi bien "un livre" que "une livre" même si ça ne correspond pas à la même chose.
La deuxième ligne concerne quant à elle le verbe livrer, à la 1è, 2è ou 3è personne du singulier, selon les différents temps.
Je n'y connais rien en linguistique, donc je vais juste citer le manuel de Lexique3, Chapitre 5
ortho : le mot
phon : les formes phonologiques du mot
lemme : les lemmes de ce mot
cgram : les catégories grammaticales de ce mot
genre : le genre
nombre : le nombre
freqlemfilms : la fréquence du lemme selon le corpus de sous-titres (par million d'occurrences)
freqlemlivres : la fréquence du lemme selon le corpus de livres (par million d'occurrences)
freqfilms : la fréquence du mot selon le corpus de sous-titres (par million d'occurrences)
freqlivres : la fréquence du mot selon le corpus de livres (par million d'occurrences)
infover : modes, temps, et personnes possibles pour les verbes
nbhomogr : nombre d'homographes
nbhomoph : nombre d'homophones
islem : indique si c'est un lemme ou pas
nblettres : le nombre de lettres
nbphons : nombre de phonèmes
cvcv : la structure orthographique
p-cvcv : la structure phonologique
voisorth : nombre de voisins orthographiques
voisphon : nombre de voisins phonologiques
puorth : point d'unicité orthographique
puphon : point d'unicité phonologique
syll : forme phonologique syllabée
nbsyll : nombre de syllabes
cv-cv : structure phonologique syllabée
orthrenv : forme orthograhique inversée
phonrenv : forme phonologique inversée
orthosyll : forme orthographique syllabée
ortho : le mot
phon : les formes phonologiques du mot
lemme : les lemmes de ce mot
cgram : les catégories grammaticales de ce mot
genre : le genre
nombre : le nombre
freqlemfilms : la fréquence du lemme selon le corpus de sous-titres (par million d'occurrences)
freqlemlivres : la fréquence du lemme selon le corpus de livres (par million d'occurrences)
freqfilms : la fréquence du mot selon le corpus de sous-titres (par million d'occurrences)
freqlivres : la fréquence du mot selon le corpus de livres (par million d'occurrences)
infover : modes, temps, et personnes possibles pour les verbes
nbhomogr : nombre d'homographes
nbhomoph : nombre d'homophones
islem : indique si c'est un lemme ou pas
nblettres : le nombre de lettres
nbphons : nombre de phonèmes
cvcv : la structure orthographique
p-cvcv : la structure phonologique
voisorth : nombre de voisins orthographiques
voisphon : nombre de voisins phonologiques
puorth : point d'unicité orthographique
puphon : point d'unicité phonologique
syll : forme phonologique syllabée
nbsyll : nombre de syllabes
cv-cv : structure phonologique syllabée
orthrenv : forme orthograhique inversée
phonrenv : forme phonologique inversée
orthosyll : forme orthographique syllabée
Toujours dans le chapitre 5 du manuel, je cite :
Informations verbales (infover) : Ce sont les informations de mode, de temps, et de personne que sont susceptibles de prendre les formes verbales Mode ind indicatif cnd conditionnel sub subjonctif par participe inf infinitif imp impératif Temps pre présent fut futur imp imparfait pas passé Personne 1s 1ère personne du singulier 2s 2ème personne du singulier 3s 3ème personne du singulier 1p 1ère personne du pluriel 2p 2ème personne du pluriel 3p 3ème personne du pluriel
Pour avoir le fichier au format .txt.
Il faut télécharger le Zip, puis le décompresser.
Dans le dossier Lexique370, il faut choisir le dossier Bases+Scripts, puis Lexique3.txt
Etant donné la taille du fichier (23,8 Mo), l'ouverture du fichier sera très lente avec le Bloc-Notes.
Mais a priori, la visualisation brute du fichier n'est pas le but premier de ce fichier.
Pour ce qui est de l'extraction des données de manières automatisées, le format des données est :
merci
1_ortho \t 2_phon \t 3_lemme \t ... \t 35_nbmorph \n
sont les attributs d'une table et les mots sont remplis dans cette table
merci beaucoup