Nettoyage des textes

Fermé
a.qechchar - 28 juin 2016 à 17:10
Whismeril Messages postés 19022 Date d'inscription mardi 11 mars 2003 Statut Contributeur Dernière intervention 17 avril 2024 - 29 juin 2016 à 16:26
Bonjour communauté, j'essaie de résoudre un problème de nettoyage des textes de nature juridique, et j'ai lu quelque part que les langage java et PYTHON le font veuillez confirmez svp
A voir également:

2 réponses

ElementW Messages postés 4816 Date d'inscription dimanche 12 juin 2011 Statut Contributeur Dernière intervention 5 octobre 2021 1 225
28 juin 2016 à 18:33
'lut
Qu'entends-tu par "nettoyage"?
0
Découpage des textes en des extraits, vérification orthographique, mais il s'est avéré que les deux langage s'occupent juste du nettoyage des balise html contenues dans un texte prière de me recommandé une technique pour faire tout cela de manière automatisée
Merci
0
Whismeril Messages postés 19022 Date d'inscription mardi 11 mars 2003 Statut Contributeur Dernière intervention 17 avril 2024 928
29 juin 2016 à 16:26
Bonjour

découper des extraits de texte est réalisable avec n'importe quel langage, le tout est de connaitre la règle pour découper.

Il existe un outil puissant, commun à de nombreux langage, la Regex.

La correction orthographique c'est une autre histoire, c'est aussi compliqué que la première partie est simple.
Il me semble judicieux d'utiliser ce qui existe déjà:
  • les traitements de texte.

Tu pourrais fournis tes extrais à Word, OpenOffice, Pages, etc... et traiter l'orthographe dans ces logiciels.
  • les bibliothèques diverses, existantes sur le net, j'en ai trouvé quelques unes rapidement sur mon moteur de recherche préféré.


0