Logiciel OCR windows 8

Résolu/Fermé
kusskusses Messages postés 33 Date d'inscription dimanche 6 juillet 2014 Statut Membre Dernière intervention 21 septembre 2020 - 3 janv. 2016 à 09:42
contrariness Messages postés 19429 Date d'inscription samedi 10 juillet 2010 Statut Membre Dernière intervention 22 avril 2024 - 3 janv. 2016 à 18:42
Bonjour,

Je souhaiterais télécharger ou acheter un logiciel OCR pour saisir un texte dactylographié (c'est un livre) qui sera donc en format image ou pdf une fois scanné. Mon objectif est de pouvoir exploiter ce texte pour faire de la recherche rapide.
Le texte est assez long (plus de 400 pages ; avec notes de bas de page) et est en ancien français, et j'aimerais surtout éviter de passer des journées entières à corriger les coquilles d'un logiciel inefficace.

1) Existe-t-il un logiciel suffisamment performant pour mon travail ?
2) La langue ancien français ne risque-t-elle pas de faire complètement bugger la reconnaissance de caractères? J'imagine que si la reconnaissance se fait sur la base des lettres, l'ancienneté de la langue ne posera pas de problème, mais si elle se fait au départ des mots (du français moderne), l'opération ne fonctionnera pas du tout.

Merci d'avance de votre aide!

PS : Je n'ai aucune connaissance en informatique et j'ai découvert l'existence des logiciels OCR ce matin.


A voir également:

1 réponse

contrariness Messages postés 19429 Date d'inscription samedi 10 juillet 2010 Statut Membre Dernière intervention 22 avril 2024 6 051
3 janv. 2016 à 12:29
Si vous scannez vos pages vous meme, il est fort possible qu'avec le scanner soit inclus un logiciel d'OCR... c'est assez courant.

Pour eviter les erreurs et avoir le minimum de correction a faire par la suite (il y en a car la conversion est rarement totalement parfaite), il faut que le scan soit de bonne resolution, et qu'il n'y ai pas des taches parasites qui fausseraient la reconnaissance.

La reconnaissance se base sur 2 choses, la forme de la lettre, et la comparaison d'un bloc de lettre avec une bibliotheque de mots. C'est pour cela que la configuration pour la langue du texte a reconnaitre est necessaire.

Les softs specifiques comme "Omnipage Pro" ont la possibilite d'augmenter les mots de leur bibliotheque et ainsi quand la premiere correction se fait (le soft affiche la conversion et permet a l'utilisateur de faire une premiere analyse pour les mots non reconnus) on peut rajouter les mots afin de plus avoir de rejet sur le meme mot plus loin dans le texte.

Ensuite l'ideal est de repasser le texte dans un logiciel de traitement de texte ayant une correction grammaticale et orthographique automatique. Et enfin de relire pour detecter les incoherences.
1
kusskusses Messages postés 33 Date d'inscription dimanche 6 juillet 2014 Statut Membre Dernière intervention 21 septembre 2020
3 janv. 2016 à 13:31
Alors il n'existe pas de logiciel qui se base uniquement sur la reconnaissance des lettres?
Je vois que certains logiciels comportent la reconnaissance du latin et du français, l'ancien français utilise l'alphabet français mais se caractérise par des variations graphiques élevées (par exemple, "feuille" peut s'écrire aussi : faulle, feule, feulle, fieulle, foeulle, fueille, fuille, fulle, ce qui ferait énormément de mots à ajouter sur un texte long). Une solution pour ce type de langue?
0
contrariness Messages postés 19429 Date d'inscription samedi 10 juillet 2010 Statut Membre Dernière intervention 22 avril 2024 6 051
3 janv. 2016 à 14:35
Ca ne sera pas vraiment un probleme avec un OCR..

Si le mot est bien reconnu (pas d'ambiguite de forme entre un "ri" et un "n") il sortira pas forcement en anomalie.. Le logiciel ne vous mettra pas "feuille" a la place de "feule"..

C'est lorsque un caractere (ou 2, 3 consecutifs) peuvent se confondre que le soft cherche si un mot existe dans la bibliotheque.

Par contre les caracteres anciens avec des accents peuvent ne pas etre traduits correctement ainsi que les polices cursives... Ce genre de soft ne reconnait bien que les polices de caracteres serif et sans-serif
0
kusskusses Messages postés 33 Date d'inscription dimanche 6 juillet 2014 Statut Membre Dernière intervention 21 septembre 2020
3 janv. 2016 à 14:53
D'accord, merci beaucoup de cette réponse très complète!
Une dernière petite question : si j'ai déjà un document intégralement scanné (une v. image et une v. pdf) avec le texte dont je parle et que je souhaite faire un premier essai avec un logiciel gratuit, lequel me conseilleriez-vous ?
0
contrariness Messages postés 19429 Date d'inscription samedi 10 juillet 2010 Statut Membre Dernière intervention 22 avril 2024 6 051
3 janv. 2016 à 18:42
Je suppose qu'il en existe des gratuits...
Perso je connais Omnipage et Acobat "pro".. mais ils sont payants.

Il y en a egalement des "online" si vous n'avez pas peur d'envoyer un document vers un site inconnu..

Vous devriez facilement en trouver via les moteurs de recherche.
0