Nettoyage des textes

a.qechchar -  
 Utilisateur anonyme -
Bonjour communauté, j'essaie de résoudre un problème de nettoyage des textes de nature juridique, et j'ai lu quelque part que les langage java et PYTHON le font veuillez confirmez svp
A voir également:

2 réponses

ElementW Messages postés 4814 Date d'inscription   Statut Contributeur Dernière intervention   1 223
 
'lut
Qu'entends-tu par "nettoyage"?
0
a.qechchar
 
Découpage des textes en des extraits, vérification orthographique, mais il s'est avéré que les deux langage s'occupent juste du nettoyage des balise html contenues dans un texte prière de me recommandé une technique pour faire tout cela de manière automatisée
Merci
0
Utilisateur anonyme
 
Bonjour

découper des extraits de texte est réalisable avec n'importe quel langage, le tout est de connaitre la règle pour découper.

Il existe un outil puissant, commun à de nombreux langage, la Regex.

La correction orthographique c'est une autre histoire, c'est aussi compliqué que la première partie est simple.
Il me semble judicieux d'utiliser ce qui existe déjà:
  • les traitements de texte.

Tu pourrais fournis tes extrais à Word, OpenOffice, Pages, etc... et traiter l'orthographe dans ces logiciels.
  • les bibliothèques diverses, existantes sur le net, j'en ai trouvé quelques unes rapidement sur mon moteur de recherche préféré.


0