Reconnaissance de caractères difficile

Fermé
sim49 Messages postés 32 Date d'inscription vendredi 15 octobre 2004 Statut Membre Dernière intervention 15 septembre 2008 - 18 mars 2006 à 08:14
Gihef Messages postés 5150 Date d'inscription mercredi 20 juillet 2005 Statut Contributeur Dernière intervention 20 février 2023 - 18 mars 2006 à 14:47
Bonjour,
Je sais bien que le sujet a déjà été traité mais permettez moi d'y revenir car je trouve que les résultats de cette technique sont catastrophiques quelque soient les logiciels.
Je pensais que les OCR fournis avec les différents matériels ( par exemple Omnipage SE ) étaient légers et responsables de l'inefficacité...mais j'ai testé des logiciels pro en démo et ce n'est pas beaucoup mieux !
Même un simple texte Word ou un simple tableau d'excel n'est pas reconnu sans déformations ou erreurs grotesques ( par exemple la non reconnaissance d'un simple point d'interrogation...)
Je me pose donc ces questions :
Peut-on réellement avoir des résultats ?
Y a-t-il une technique particulière ? des astuces ? des précautions à prendre ? des réserves ? des limites ?
Aidez moi à y répondre...
Merci d'avance
A voir également:

1 réponse

Gihef Messages postés 5150 Date d'inscription mercredi 20 juillet 2005 Statut Contributeur Dernière intervention 20 février 2023 2 778
18 mars 2006 à 14:47
Bonjour,

Tu demandes la reconnaissance à partir de quel type de document (scan…) ?

Si tu scannes à partir de choses imprimées, indique à ton scanner que c'est le cas ou demande lui de désentrelacer.
Si tu le fais à partir de scans, il faut que tu offres à ton logiciel d'OCR un document très contrasté. Des noirs bien noirs et des clairs bien blancs.
Il est aussi préférable de ne lui donner que des scans bien propres à traiter. Pas de jpeg trop compressés, par exemple, avec une dégradation importante.
Il faut peut-être aussi que tu lui indiques à quel genre de document il doit s'attaquer. Article, colonnes, tableaux, images… Où sont les données qui t'intéressent dans le document…
0