Nettoyage des textes [Fermé]

Signaler
-
Messages postés
15915
Date d'inscription
mardi 11 mars 2003
Statut
Contributeur
Dernière intervention
5 mai 2021
-
Bonjour communauté, j'essaie de résoudre un problème de nettoyage des textes de nature juridique, et j'ai lu quelque part que les langage java et PYTHON le font veuillez confirmez svp

2 réponses

Messages postés
4761
Date d'inscription
dimanche 12 juin 2011
Statut
Contributeur
Dernière intervention
23 octobre 2020
1 235
'lut
Qu'entends-tu par "nettoyage"?
Découpage des textes en des extraits, vérification orthographique, mais il s'est avéré que les deux langage s'occupent juste du nettoyage des balise html contenues dans un texte prière de me recommandé une technique pour faire tout cela de manière automatisée
Merci
Messages postés
15915
Date d'inscription
mardi 11 mars 2003
Statut
Contributeur
Dernière intervention
5 mai 2021
700
Bonjour

découper des extraits de texte est réalisable avec n'importe quel langage, le tout est de connaitre la règle pour découper.

Il existe un outil puissant, commun à de nombreux langage, la Regex.

La correction orthographique c'est une autre histoire, c'est aussi compliqué que la première partie est simple.
Il me semble judicieux d'utiliser ce qui existe déjà:
  • les traitements de texte.

Tu pourrais fournis tes extrais à Word, OpenOffice, Pages, etc... et traiter l'orthographe dans ces logiciels.
  • les bibliothèques diverses, existantes sur le net, j'en ai trouvé quelques unes rapidement sur mon moteur de recherche préféré.