Calcul du nombre d'homographes dans un texte
salyn92
Messages postés
4
Date d'inscription
Statut
Membre
Dernière intervention
-
yg_be Messages postés 23541 Date d'inscription Statut Contributeur Dernière intervention -
yg_be Messages postés 23541 Date d'inscription Statut Contributeur Dernière intervention -
Bonjour,
je travaille sur un corpus arabe et je souhaite calculer le nombre des mots homographes qui existent dans celui-ci, sachant qu'en langue arabe les voyelles sont des signes diacritiques et c'est eux qui font la différence à l'oral pour la voyellisation (homographes hétérophones, ex: شَعْرٌ/شِعْرٌ la différence est sur la première lettre avec le signe diacritique qui est placé soit au dessus ou en dessous).
je veux savoir s'il existe une fonction qui compare les éléments d'une liste qu'on peut paramétrer et qui nous renverrai ces homographes, puis calculer leur nombre dans le corpus entier.
ps: je sais que c'est trop compliqué, mais toute suggestion ou piste sera la bienvenue.
Merci d'avance :)
je travaille sur un corpus arabe et je souhaite calculer le nombre des mots homographes qui existent dans celui-ci, sachant qu'en langue arabe les voyelles sont des signes diacritiques et c'est eux qui font la différence à l'oral pour la voyellisation (homographes hétérophones, ex: شَعْرٌ/شِعْرٌ la différence est sur la première lettre avec le signe diacritique qui est placé soit au dessus ou en dessous).
je veux savoir s'il existe une fonction qui compare les éléments d'une liste qu'on peut paramétrer et qui nous renverrai ces homographes, puis calculer leur nombre dans le corpus entier.
ps: je sais que c'est trop compliqué, mais toute suggestion ou piste sera la bienvenue.
Merci d'avance :)
A voir également:
- Calcul du nombre d'homographes dans un texte
- Calcul moyenne excel - Guide
- Transcription audio en texte word gratuit - Guide
- Excel cellule couleur si condition texte - Guide
- Nombre de jours entre deux dates excel - Guide
- Mettre un texte en majuscule - Guide
1 réponse
yg_be
Messages postés
23541
Date d'inscription
Statut
Contributeur
Dernière intervention
Ambassadeur
1 584
bonjour, quelle est la partie de ton travail qui te pose problème?
as-tu commencé ton travail?
as-tu commencé ton travail?
#!/usr/local/bin/python3.6
import re
tab = []
propTab = []
with open("test.txt", mode = "r", encoding = "utf8") as f:
for line in f:
tab.append(line.rstrip())
for ligne in tab:
res = ligne.split(" ")
propTab.append(res)
print(propTab)
je veux comparer tous éléments et trouver les éléments qui ont la même graphie et différenciés seulement par les diacritiques.
voilà tout !
merci.