PROBLEME DE NUMERISASSION
Résolu/Fermé
mickael2416563
Messages postés
9
Date d'inscription
vendredi 14 mars 2008
Statut
Membre
Dernière intervention
2 août 2009
-
29 mars 2008 à 17:01
Utilisateur anonyme - 30 mars 2008 à 18:37
Utilisateur anonyme - 30 mars 2008 à 18:37
3 réponses
Utilisateur anonyme
29 mars 2008 à 18:47
29 mars 2008 à 18:47
Si je comprends bien, vous scannez du texte, et vous le chargez sous Word tel quel ?
Je crois savoir qu'un scanner livre d'abord une image d'une page ou d'une fraction de page comme une photocopie.
Dans ce cas, il ne s'agit pas de texte, mais de points (pixels image), pas de caractères ascii ou ansi.
Il me parait normal que Word interprète tout cela comme quelque chose qui n'est pas du texte et tente à sa manière d'y remédier. Très bizarre. Je n'ai jamais réussi ce genre de truc.
Passez d'abord par un logiciel de "reconnaissance de caractères" (OCR) et ensuite envoyez le résultat (texte) dans Word. Vous verrez, c'est beaucoup plus clair.
Développez s'il vous plait !
Je crois savoir qu'un scanner livre d'abord une image d'une page ou d'une fraction de page comme une photocopie.
Dans ce cas, il ne s'agit pas de texte, mais de points (pixels image), pas de caractères ascii ou ansi.
Il me parait normal que Word interprète tout cela comme quelque chose qui n'est pas du texte et tente à sa manière d'y remédier. Très bizarre. Je n'ai jamais réussi ce genre de truc.
Passez d'abord par un logiciel de "reconnaissance de caractères" (OCR) et ensuite envoyez le résultat (texte) dans Word. Vous verrez, c'est beaucoup plus clair.
Développez s'il vous plait !
la vrille
Messages postés
272
Date d'inscription
mardi 9 octobre 2007
Statut
Membre
Dernière intervention
24 décembre 2022
89
30 mars 2008 à 16:56
30 mars 2008 à 16:56
Bonjour,
GibMan a tout à fait raison... le logiciel OCR doit être fournit avec le CD d'install. de votre imprimante.
personnellement j'ai déjà utilisé cette fonction ; cela vous fera gagner beaucoup de temps sur un texte long - plusieurs pages- mais de toutes façons ; il faudra repasser tout le texte "au peigne fin" dans word , car il s'agit d'une interprétation d'image qui est ensuite convertie en texte dans word. le problème c'est que word ne sait pas lire dans l'absolu donc il y aura forcément des erreurs d'interprétation du style : la lettre M remplacée par % ou des chiffres à la place de certaines lettres et vice-versa.
GibMan a tout à fait raison... le logiciel OCR doit être fournit avec le CD d'install. de votre imprimante.
personnellement j'ai déjà utilisé cette fonction ; cela vous fera gagner beaucoup de temps sur un texte long - plusieurs pages- mais de toutes façons ; il faudra repasser tout le texte "au peigne fin" dans word , car il s'agit d'une interprétation d'image qui est ensuite convertie en texte dans word. le problème c'est que word ne sait pas lire dans l'absolu donc il y aura forcément des erreurs d'interprétation du style : la lettre M remplacée par % ou des chiffres à la place de certaines lettres et vice-versa.
eriiic
Messages postés
24603
Date d'inscription
mardi 11 septembre 2007
Statut
Contributeur
Dernière intervention
15 décembre 2024
7 248
30 mars 2008 à 17:04
30 mars 2008 à 17:04
Bonjour,
Et si ton OCR n'as de reconnaissance automatique de la langue il faut lui dire d'utiliser l'anglais
eric
Et si ton OCR n'as de reconnaissance automatique de la langue il faut lui dire d'utiliser l'anglais
eric
Une fois les caractères reconnus et transférés dans Word, on peut effectivement faire un contrôle de l'orthographe avec un dictionnaire dans la langue du texte numérisé.
Mais ça, c'est basic.
En ce qui me concerne, j'utilise le logiciel OMNIPAGE (pas donné). Son taux de réussite est très correct <95%. il est même capable de conserver la mise en page comme l'original et de reproduire des tableaux style Excel.
Il est vrai que beaucoup d'imprimantes sont livrées avec un OCR. mais ils ne fonctionnent pas toujours de façon égale et à l'usage, il peuvent s'avérer galère.
Ce qui est important, c'est l'original avant le "scannage". Le fond du papier doit être blanc de préférence et propre pour assurer un contraste homogène. Et le graphisme des caractères doit être bien dessiné et sans bavure. Pas de tâche, ni de plis de feuille.
Cependant, ça ne dispense pas du contrôle visuel pour s'assurer de la bonne intégrité du texte.
C'est toujours mieux que de se coltiner des kilomètres de frappe au clavier.
Si l'on "scanne" beaucoup de pages, c'est du boulot de la routine à l'état pur, mais ça soulage bien.
Mais ça, c'est basic.
En ce qui me concerne, j'utilise le logiciel OMNIPAGE (pas donné). Son taux de réussite est très correct <95%. il est même capable de conserver la mise en page comme l'original et de reproduire des tableaux style Excel.
Il est vrai que beaucoup d'imprimantes sont livrées avec un OCR. mais ils ne fonctionnent pas toujours de façon égale et à l'usage, il peuvent s'avérer galère.
Ce qui est important, c'est l'original avant le "scannage". Le fond du papier doit être blanc de préférence et propre pour assurer un contraste homogène. Et le graphisme des caractères doit être bien dessiné et sans bavure. Pas de tâche, ni de plis de feuille.
Cependant, ça ne dispense pas du contrôle visuel pour s'assurer de la bonne intégrité du texte.
C'est toujours mieux que de se coltiner des kilomètres de frappe au clavier.
Si l'on "scanne" beaucoup de pages, c'est du boulot de la routine à l'état pur, mais ça soulage bien.