Extraire des images (vectorielles?) de pptx ou de pdf

Fermé
josephtux Messages postés 4 Date d'inscription vendredi 14 août 2009 Statut Membre Dernière intervention 28 novembre 2015 - 29 sept. 2015 à 16:02
josephtux Messages postés 4 Date d'inscription vendredi 14 août 2009 Statut Membre Dernière intervention 28 novembre 2015 - 3 oct. 2015 à 20:34
Bonjour,

- Outils utilisés:
1 impress pour lire un document pptx et
pour produire un document pdf (export)
2 pdfimages pour extraire les images du pdf
3 convert pour transformer une page pdf en image.png


- Le problème:

le 1er élément du problème est l'absence de certaines images extraites avec
pdfimages.
le 2nd élément du problème est la qualité de l'image récupérée par
convert à partir du pdf.

Je dois récupérer les images d'un fichier pptx, pour les intégrer dans une
édition de bonne qualité.

J'ai transformé une présentation pptx avec libreoffice impress en
pdf afin d'en extraire les images avec pdfimages, car je n'ai pas
trouvé le moyen d'extraire directement ces images ( ni avec les décors
superflus d'impress, ni sans les décors, comme je les voudrais).

Le problème commence par l'absence de certaines images, (peut-être sont-elles
vectorielles ?)

Leur qualité sous pdf (produit par impress) reste bonne, même
très agrandies.
Mais la conversion du pdf en png par convert est de très mauvaise
qualité

j'ai utilisé la ligne suivante:

convert pg_0003.pdf -density 300x300 -geometry 1440x1080  pg_0003_.png


qui donne un résultat de piètre qualité (définition) à partir d'un pdf
pourtant de très bonne définition, même très agrandie.

Existe-t-il un moyen pour extraire toutes les images (images vectorielles)
d'un pdf ?

Merci


A voir également:

2 réponses

contrariness Messages postés 19422 Date d'inscription samedi 10 juillet 2010 Statut Membre Dernière intervention 19 avril 2024 6 049
Modifié par contrariness le 29/09/2015 à 19:29
Ce que vous pensez etre des images vectorielles sont peut-etre des objets.

Dans ce cas ce n'est pas considere comme une image mais comme un ensemble d'objets assembles, selectables individuellement ou en ensemble si la fonction assemblage est active.

Dans les softs libres, je ne sais pas si cela existe, dans les logiciels professionnels, c'est Acrobat "pro" qui permet cela mais en association avec un logiciel de retouche d'image (pour les images) et un logiciel de dessin vectoriel (pour les objets vectoriels).

Generalement on associe Photoshop et Illustrator, mais c'est possible avec d'autres.
0
josephtux Messages postés 4 Date d'inscription vendredi 14 août 2009 Statut Membre Dernière intervention 28 novembre 2015
3 oct. 2015 à 20:34
Bonjour,

j'ai enfin trouvé ce que sont ces objets. Ils sont effectivement repérables sous Inkscape, ce sont donc des parties d'une image vectorielle, y compris les textes associés (et dissociables).

Pour extraire ma carte, avec titres et textes:

1 Isoler la page 25 du pdf ( pdftk in.pdf cat 25 output out.pdf
2 Charger cette page dans inskscape
3 Après sélection et modification (dimension, centrage..),
4 il suffit de les exporter, soit en pdf (ils gardent leurs qualités vectorielles) soit en png ou autre bitmap, soit en pdf avec code Latex. Cette dernière option permet, par exemple, d'harmoniser les fontes avec celles du document hôte, et non du document d'origine, moins exigeantes.

La définition reste maximale en toute circonstance.
Elle peut même être améliorée, par exemple (avec travail pour replacer le texte) si on utilise les fontes du document final au lieu de celles d'origine.

Ne me reste plus qu'à apprendre les bases d' Inkscape ;)
0