Supprimer l'interlettrage

Résolu
roidesgobs Messages postés 6 Date d'inscription   Statut Membre Dernière intervention   -  
m@rina Messages postés 23902 Date d'inscription   Statut Contributeur Dernière intervention   -
Bonjour,

Bonjour,

J'ai recuperé des documents via pdf.
Je souhaite ressortir les textes sur celui ci.

Pour ce faire , je sélectionne tous simplement mes textes et je les copie colle sur mon Notepad+++
Sur 99% des pdf cette methode fonctionne , mais pour 1 d'entre eux j'ai un gros souci.
Une fois collé le texte désiré j'obtient de l'interlettrage !!!

voila la forme du resultat : l e s t e x t e s s o n t s é p a r é s !
Tout mon texte est séparé par un expace entre lettre , MAIS les espaces entre mots est quand à lui resté à l'identique.

Pour resumé j'ai 1 espace partout sur mon document.
J'ai pensé dans un premier temps supprimer tout les Espaces sur Notepad+++ mais au résultats j'obtient un pavé monobloc et je dois reséparé tous les mots , bref infaisable.
Sachant que j'ai 92 pages de pdf à recup ....
Quelqu'un à une solution miracle svp ?

A voir également:

6 réponses

roidesgobs Messages postés 6 Date d'inscription   Statut Membre Dernière intervention   1
 
oui bien sur j'ai fait un export sur word pdf extractor et Notepad +++ , mais rien n'y fait , la structure est comme cela , je ne la changerais pas. Je demande plutôt de l'aide sur un outil qui me permettrai de sestructurer le texte en supprimant les espaces interlettrage.
1
C-Claire Messages postés 4014 Date d'inscription   Statut Membre Dernière intervention   2 247
 
Bonjour,

tu peux mettre une page du pdf sur https://www.cjoint.com/ et donner le lien ici ?
0
roidesgobs Messages postés 6 Date d'inscription   Statut Membre Dernière intervention   1
 
Le pdf est en anglais avec un copyright c'est un probleme ?
0
C-Claire Messages postés 4014 Date d'inscription   Statut Membre Dernière intervention   2 247
 
Pas pour moi (le reste regarde ta conscience), mais tu peux mettre une page seulement.

C-Claire
0
roidesgobs Messages postés 6 Date d'inscription   Statut Membre Dernière intervention   1
 
je peux faire un copier collé ici du texte si tu veux , mais je ne souhaite pas faire une coppy du pdf , il s'agit d'une grosse entreprise , je ne souhaite pas avoir d'ennuie ; ;

voila une partie du texte une fois collé :


A s c h a r a c t e r s a p p r o a c h G r e e n e s t , th e y s e e th a t a b lu e
d r a g o n a n d its C u lt o f th e D r a g o n a l l ie s a r e a t t a c k in g
th e t ow n . T h e c u l t is t s s e e k to c o l l e c t t r e a s u r e th a t th e y
h o p e to p r e s e n t t o T iam a t u p o n h e r a r r iv a l in th e w o r ld .
T h e cu lt h a s a s s em b le d a p ow e r fu l f o r c e f o r th is r a id b y
g a th e r in g b a n d i t s , k o b o ld s , s e l lsw o r d s , a n d o th e r m e r c
e n a r y t y p e s in t o a sm a l l a rm y . A m o n k n am e d L e o s in
E r la n th a r w a s a ls o in t ow n . T h r o u g h d i l ig e n t r e s e a r c h
a n d in t e r v iew s c o n d u c t e d d u r in g h is t r a v e ls b e tw e e n
B e r d u s k a n d C a n d le k e e p , L e o s in b e c a m e c o n v in c e d
th a t th e c u l t is e n g a g e d in a b ig o p e r a t io n , b u t h e d o e s n 't
y e t k n o w w h a t it is . L e o s in u s e s th e r a id a s a n o p p o r t u n
it y t o in f i lt r a te th e c u l t s o th a t h e c a n le a r n m o r e a b o u t
th e c u l t 's p la n s . H e is d is c o v e r e d a n d c a p tu r e d , h ow e v e r ,
a n d n e e d s th e c h a r a c t e r s ' h e lp to e s c a p e f r om ca p t iv ity .
C h a r a c t e r s c a n e n g a g e in s e v e r a l e n c o u n t e r s w h i le
c u l t is t s a n d k o b o ld s r am p a g e t h r o u g h G r e e n e s t .
0
C-Claire Messages postés 4014 Date d'inscription   Statut Membre Dernière intervention   2 247 > roidesgobs Messages postés 6 Date d'inscription   Statut Membre Dernière intervention  
 
Je comprends. Mais ce texte ne m'aide pas à t'aider.
Ayant Acrobat Pro, avec le pdf, j'aurais pu voir si les espaces sont dus à un interlettrage converti en espaces dans ton logiciel ou si c'est une police de caractères non standard, et voir comment traiter cela en passant pas Word par exemple.

Essaie de passer par un convertisseur PDF -> Text (ou Word) gratuit, le résultat sera peut-être meilleur qu'avec le copier/coller.

Bon courage et que cela ne te gâche pas le réveillon,

C-Claire
0
roidesgobs Messages postés 6 Date d'inscription   Statut Membre Dernière intervention   1
 
J'ai tenter avec adobe pro et A-Text extractor.

Les 2 ont obtenus le meme resultat.
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
m@rina Messages postés 23902 Date d'inscription   Statut Contributeur Dernière intervention   11 464
 
Bonjour,

Au lieu de copier-coller, as tu tenté de faire un export vers Word par exemple ?

m@rina
0
roidesgobs Messages postés 6 Date d'inscription   Statut Membre Dernière intervention   1
 
J'ai finallement trouver une solution avec un OCR.

Merci et bon reveillon
0
m@rina Messages postés 23902 Date d'inscription   Statut Contributeur Dernière intervention   11 464
 
merci pour le retour.
Bon réveillon à toi et bonne année... sans interlettrage ! ;)
0