Reproduire un texte avec OCR

Signaler
Messages postés
87
Date d'inscription
vendredi 3 octobre 2008
Statut
Membre
Dernière intervention
23 février 2021
-
Messages postés
31019
Date d'inscription
mercredi 2 mai 2007
Statut
Modérateur
Dernière intervention
23 février 2021
-
Bonjour, chers amis. Aidez moi s'il vous plait. Je suppose pour vous c'est banal mais moi je suis et je reste ignorant cc. toute électronique.
J'ai tout un livre de remettre en text soit "text maker" soit "open office" pour le corriger et re-écrire.
On me dit ça se fait avec OCR
Je vous prie de m'expliquer pas par pas (imaginez que je suis un mec un peu ignorant et presque aveugle svp; j'ai 82 ans mais je ne veux pas accepter que l'internet n'est pas pour moi) comment je dois faire.
Si nécéssaire je peux (?) aussi télécharger un autre sytème de texte (QUE GRATOS SVP)
Merci d'avance
Michael



Configuration: Windows / Chrome 88.0.4324.182

5 réponses

Messages postés
25
Date d'inscription
dimanche 7 février 2021
Statut
Membre
Dernière intervention
23 février 2021
1
Un "OCR" est un logiciel de reconnaissance de texte (il y en a des gratuits).
Pour passer du texte dans un OCR il faut d'abord en faire une image (le scanner, avec un scanner).
Les résultats sont rarement très satisfaisants.
Messages postés
87
Date d'inscription
vendredi 3 octobre 2008
Statut
Membre
Dernière intervention
23 février 2021

Merci vous êtes gentil;
ça ne resout pas mon prob.Mes scans sont bons mais avec quel OCR les transformer en nouveau texte.?
Bonne journée
Messages postés
46186
Date d'inscription
dimanche 20 janvier 2008
Statut
Modérateur
Dernière intervention
23 février 2021
10 014
Je confirme
Vous devez avez un scanner ou une imprimante scanner, et scanner chaque page qui est une image.
En fonction de la qualité du scanner et de la qualité des pages imprimées, le logiciel OCR reconnaitra chaque caractère dans l'image et le remplacera par du texte dans une page.

Mais il faudra revoir chaque page ensuite manuellement car le logiciel peut très bien ne pas reconnaitre un partie de chaque page. Dans tout les cas c'est un long travail, je l'ai déjà fait pour un livre il y a 20 ans.

Si vous avez de problèmes de vision et que vous n'avez pas d'aide, cela pourrait être encore plus difficile que de retaper le texte lui même.
En tout cas vous devriez faire un essais avant de vous décider.

Je ne peux que vous encourager à trouver une aide pour ce travail.

bav
Messages postés
31019
Date d'inscription
mercredi 2 mai 2007
Statut
Modérateur
Dernière intervention
23 février 2021
7 400
Bonjour,

Pour compléter, de nombreuses imprimantes scanner sont livrées avec un logiciel OCR. C'est par exemple le cas de ma Canon TS8251, en scannant un document, on peut obtenir un pdf, une image ou le texte généré par l'OCR embarqué.

On peut penser qu'un livre sera plus facilement reconnaissable que d'autres documents plus complexes.

Je viens de faire un essai. Voila l'image de la page :


Le logiciel OCR de l'imprimante fournit le texte suivant :
Les bureaux de RC étaient près des quais, au coin d'Alice et de la
4" Rue, coincés entre le port marchand d'Oakland et le quartier
chinois de la ville, dans un immeuble mome où une porte sur deux
arborait le nom d'une compagnie de fret maritime.
Une sonnette fixée à la porte émit un petit ding lorsque j'entrai.
La pièce elle-même avait été agencée et décorée d'une façon qui
devait rendre ses occupants envieux du Bob Cratchit de Dickens.
Sur douze tables de bois reposaient autant de grands buvards verts
qui ressemblaient à présent au test de Rorschach le plus ambitieux
du monde. Des piles de papier à musique et de papier pelure atten-
daient sur la gauche de chaque table. Des tubes fluorescents au néon
fixés au plafond anéantissaient les ombres que douze lampes à col
de cygne n'avaient pas déjà éliminées.
Il y avait 1à sept hommes d'un âge varié et une femme dans la
quarantaine, s'activant tous sur différents projets.
Un long comptoir séparait cette zone de travail de l'antichambre
des bureaux. Derrière celui-ci, un homme doté d'une fine moustache
poivre et sel martelait une machine à écrire Underwood. Il consulta
quelques notes sur un registre à sa gauche. << Oui, monsieur, me
dit-il sans lever le nez de son labeur.
- J'ai une partition que j'aimerais faire reporter instrument par
instrument en vue d'une répétition ce samedi. Vous pouvez me fahe
un devis?
- Un devis, ça prend du temps. Vous faites partie du syndicat ?
- Oui.
- Je peux voir votre carte, s'il vous plaît? »
Je sortis mon portefeuille et lui tendis ma carte de la Fédération
américaine des musiciens, cellule 802. I1 me la rendit et se remit à
taper. Je pensai qu'il était sur le point de finir quelque chose, mais
au bout d'une minute entière, j'eus la sensation qu'il n'ouvrirait plus
jamais la bouche, aussi demandai-je : << Et donc ? >>
I1 retira la feuille de papier du chariot de sa machine. << En géné-
ral, nous ne prenons pas les travaux des compositeurs qui ne sont
pas d'ici.
- Mais cette pièce sera jouée ici, sur 1'î1e au Trésor.
- Mais vous, vous n'êtes pas d'ici. Il faudrait nous payer
d'avance, et en totalité.
- Soit, mais combien ?
  • Impossible de le savoir, dit-il avec un haussement d'épaules,avant que le travail soit terminé. »t76


J'avais aussi référencé un logiciel : http://www.boxoft.com/free-ocr/

Je l'ai installé, il peut générer le texte depuis une image, ou aussi directement depuis mon imprimante. Voilà lui le texte qu'il donne :

Les bureaux de RC étaient près des quais, au coin d`Alice et de la
4°Rue. coincés entre le port marchand d’Oakland et le quartier
chinois de la ville, dans un immeuble morne où une porte sur deux
arborait le nom d’une compagnie de fret maritime.
Une sonnette ûxée à la porte émit un petit ding lorsque j’entrai,
La pièce elle—même avait été agencée et décorée d’une façon qui
devait rendre ses occupants envieux du Bob Cratchit de Dickens.
Sur douze tables de bois reposaient autant de grands buvards verts
qui ressemblaient à présent au test de Rorschach le plus ambitieux
du monde. Des piles de papier ai musique et de papier pelure atten-
daient sur la gauche de chaque table. Des tubes fluorescents au néon
fixés au plafond anéantissaient les ombres que douze lampes it col
de cygne n’avaient pas déjà éliminées.
Il y avait là sept hommes d'un âge varié et une femme dans la
quarantaine, s`activant tous sur différents projets.
Un long comptoir séparait cette zone de travail de l’antichambre
des bureaux. Den·iere celui—ci, un homme doté d’une fine moustache
poivre et sel martelait une machine à écrire Underwood. Il consulta
quelques notes sur un registre à sa gaucher « Oui, monsieur, me
dit-il sans lever le nez de son labeur.
» J ’ai une partition que j’aimerais faire reporter instrument par
instrument en vue d’une répétition ce samedi. Vous pouvez me faire
un devis?
— Un devis, ça prend du temps. Vous faites partie du syndicat'?
» Oui.
» Je peux voir votre carte, s’il vous plait? »
Je sortis mon portefeuille et lui tendis ma carte de la Fédération
américaine des musiciens, cellule 802. Il me la rendit et se remit à
taper. Je pensai qu’il était sur le point de finir quelque chose, mais
au bout d’urte minute entière, j’eus la sensation qu`il n`ouvrirait plus
jamais la bouche, aussi demandai—je : « Et donc? »
ll retira la feuille de papier du chariot de sa machine. « En géné-
ral, nous ne prenons pas les travaux des compositeurs qui ne sont
pas d’ici.
» Mais cette pièce sera jouée ici, sur l’île au Trésor.
— Mais vous, vous n'êtes pas d`ici. il faudrait nous payer
d’avance, et en totalité.
- Soit, mais combien?
— Impossible de le savoir, dit-il avec un haussement d’épaules,
avant que le travail soit temiiné. »


Les 2 présentent des imperfections, mais c'est plutôt pas mal pour un premier jet sans préparation particulière. Car il faudrait aussi prendre le temps de parfaire le document scanné, bien le mettre à plat, pour un livre il faudrait peut être le découper pour que la reliure ne gêne pas, et régler luminosité et éclairage du scan pour obtenir une bonne image adaptée au document de base.


Messages postés
87
Date d'inscription
vendredi 3 octobre 2008
Statut
Membre
Dernière intervention
23 février 2021

merci
quel OCR et quel sytème d'écrire recommandez vous (il ya des gratuits mais qui enfin demandnet que vous achetez le syteme d'écrire - je ne veux pas)
Boonne journée
Messages postés
25
Date d'inscription
dimanche 7 février 2021
Statut
Membre
Dernière intervention
23 février 2021
1