reconnaissance de caractères difficile

Question

Bonjour,
Je sais bien que le sujet a déjà été traité mais permettez moi d'y revenir car je trouve que les résultats de cette technique sont catastrophiques quelque soient les logiciels.
Je pensais que les OCR fournis avec les différents matériels ( par exemple Omnipage SE ) étaient légers et responsables de l'inefficacité...mais j'ai testé des logiciels pro en démo et ce n'est pas beaucoup mieux !
Même un simple texte Word ou un simple tableau d'excel n'est pas reconnu sans déformations ou erreurs grotesques ( par exemple la non reconnaissance d'un simple point d'interrogation...)
Je me pose donc ces questions :
Peut-on réellement avoir des résultats ?
Y a-t-il une technique particulière ? des astuces ? des précautions à prendre ? des réserves ? des limites ?
Aidez moi à y répondre...
Merci d'avance

Gihef · Answer

Bonjour,

Tu demandes la reconnaissance à partir de quel type de document (scan…) ?

Si tu scannes à partir de choses imprimées, indique à ton scanner que c'est le cas ou demande lui de désentrelacer.
Si tu le fais à partir de scans, il faut que tu offres à ton logiciel d'OCR un document très contrasté. Des noirs bien noirs et des clairs bien blancs.
Il est aussi préférable de ne lui donner que des scans bien propres à traiter. Pas de jpeg trop compressés, par exemple, avec une dégradation importante.
Il faut peut-être aussi que tu lui indiques à quel genre de document il doit s'attaquer. Article, colonnes, tableaux, images… Où sont les données qui t'intéressent dans le document…

Reconnaissance de caractères difficile

1 réponse

Discussions similaires

Newsletters