Logiciel OCR windows 8
Résolu
kusskusses
Messages postés
33
Date d'inscription
Statut
Membre
Dernière intervention
-
contrariness Messages postés 21236 Date d'inscription Statut Membre Dernière intervention -
contrariness Messages postés 21236 Date d'inscription Statut Membre Dernière intervention -
Bonjour,
Je souhaiterais télécharger ou acheter un logiciel OCR pour saisir un texte dactylographié (c'est un livre) qui sera donc en format image ou pdf une fois scanné. Mon objectif est de pouvoir exploiter ce texte pour faire de la recherche rapide.
Le texte est assez long (plus de 400 pages ; avec notes de bas de page) et est en ancien français, et j'aimerais surtout éviter de passer des journées entières à corriger les coquilles d'un logiciel inefficace.
1) Existe-t-il un logiciel suffisamment performant pour mon travail ?
2) La langue ancien français ne risque-t-elle pas de faire complètement bugger la reconnaissance de caractères? J'imagine que si la reconnaissance se fait sur la base des lettres, l'ancienneté de la langue ne posera pas de problème, mais si elle se fait au départ des mots (du français moderne), l'opération ne fonctionnera pas du tout.
Merci d'avance de votre aide!
PS : Je n'ai aucune connaissance en informatique et j'ai découvert l'existence des logiciels OCR ce matin.
Je souhaiterais télécharger ou acheter un logiciel OCR pour saisir un texte dactylographié (c'est un livre) qui sera donc en format image ou pdf une fois scanné. Mon objectif est de pouvoir exploiter ce texte pour faire de la recherche rapide.
Le texte est assez long (plus de 400 pages ; avec notes de bas de page) et est en ancien français, et j'aimerais surtout éviter de passer des journées entières à corriger les coquilles d'un logiciel inefficace.
1) Existe-t-il un logiciel suffisamment performant pour mon travail ?
2) La langue ancien français ne risque-t-elle pas de faire complètement bugger la reconnaissance de caractères? J'imagine que si la reconnaissance se fait sur la base des lettres, l'ancienneté de la langue ne posera pas de problème, mais si elle se fait au départ des mots (du français moderne), l'opération ne fonctionnera pas du tout.
Merci d'avance de votre aide!
PS : Je n'ai aucune connaissance en informatique et j'ai découvert l'existence des logiciels OCR ce matin.
A voir également:
- Logiciel OCR windows 8
- Clé windows 8 - Guide
- Logiciel montage vidéo gratuit windows 10 - Guide
- Logiciel ocr - Télécharger - Divers Bureautique
- Desinstaller logiciel windows - Guide
- Money logiciel - Télécharger - Comptabilité & Facturation
1 réponse
Si vous scannez vos pages vous meme, il est fort possible qu'avec le scanner soit inclus un logiciel d'OCR... c'est assez courant.
Pour eviter les erreurs et avoir le minimum de correction a faire par la suite (il y en a car la conversion est rarement totalement parfaite), il faut que le scan soit de bonne resolution, et qu'il n'y ai pas des taches parasites qui fausseraient la reconnaissance.
La reconnaissance se base sur 2 choses, la forme de la lettre, et la comparaison d'un bloc de lettre avec une bibliotheque de mots. C'est pour cela que la configuration pour la langue du texte a reconnaitre est necessaire.
Les softs specifiques comme "Omnipage Pro" ont la possibilite d'augmenter les mots de leur bibliotheque et ainsi quand la premiere correction se fait (le soft affiche la conversion et permet a l'utilisateur de faire une premiere analyse pour les mots non reconnus) on peut rajouter les mots afin de plus avoir de rejet sur le meme mot plus loin dans le texte.
Ensuite l'ideal est de repasser le texte dans un logiciel de traitement de texte ayant une correction grammaticale et orthographique automatique. Et enfin de relire pour detecter les incoherences.
Pour eviter les erreurs et avoir le minimum de correction a faire par la suite (il y en a car la conversion est rarement totalement parfaite), il faut que le scan soit de bonne resolution, et qu'il n'y ai pas des taches parasites qui fausseraient la reconnaissance.
La reconnaissance se base sur 2 choses, la forme de la lettre, et la comparaison d'un bloc de lettre avec une bibliotheque de mots. C'est pour cela que la configuration pour la langue du texte a reconnaitre est necessaire.
Les softs specifiques comme "Omnipage Pro" ont la possibilite d'augmenter les mots de leur bibliotheque et ainsi quand la premiere correction se fait (le soft affiche la conversion et permet a l'utilisateur de faire une premiere analyse pour les mots non reconnus) on peut rajouter les mots afin de plus avoir de rejet sur le meme mot plus loin dans le texte.
Ensuite l'ideal est de repasser le texte dans un logiciel de traitement de texte ayant une correction grammaticale et orthographique automatique. Et enfin de relire pour detecter les incoherences.
Je vois que certains logiciels comportent la reconnaissance du latin et du français, l'ancien français utilise l'alphabet français mais se caractérise par des variations graphiques élevées (par exemple, "feuille" peut s'écrire aussi : faulle, feule, feulle, fieulle, foeulle, fueille, fuille, fulle, ce qui ferait énormément de mots à ajouter sur un texte long). Une solution pour ce type de langue?
Si le mot est bien reconnu (pas d'ambiguite de forme entre un "ri" et un "n") il sortira pas forcement en anomalie.. Le logiciel ne vous mettra pas "feuille" a la place de "feule"..
C'est lorsque un caractere (ou 2, 3 consecutifs) peuvent se confondre que le soft cherche si un mot existe dans la bibliotheque.
Par contre les caracteres anciens avec des accents peuvent ne pas etre traduits correctement ainsi que les polices cursives... Ce genre de soft ne reconnait bien que les polices de caracteres serif et sans-serif
Une dernière petite question : si j'ai déjà un document intégralement scanné (une v. image et une v. pdf) avec le texte dont je parle et que je souhaite faire un premier essai avec un logiciel gratuit, lequel me conseilleriez-vous ?
Perso je connais Omnipage et Acobat "pro".. mais ils sont payants.
Il y en a egalement des "online" si vous n'avez pas peur d'envoyer un document vers un site inconnu..
Vous devriez facilement en trouver via les moteurs de recherche.