Je souhaiterais savoir comment être sûr qu'un fichier PDF que j'ai généré ne contient aucune information personnelle comme mon nom, le nom de mon PC, le soft utilisé pour générer le pdf, etc.
Au-delà du pdf, je voudrais être sûr que les éléments intégrés au PDF (principalement les images j'imagine) sont eux aussi totalement anonymes.
En gros comment virer toutes les métas informations et autres paramètres/propriétés !!
J'ai déjà virer les propriétés du PDF avec une option de pdftk permettant d'exporter tous les paramètres puis d'en importer de nouveaux en lieu et place des anciens.
pdftk file.pdf dump_data > properties.txt
Le fichier properties contient qqchose comme :
InfoKey: Author
InfoValue: Blabla author
InfoKey: Title
InfoValue: The title of my history
InfoKey: Subject
InfoValue: my life
InfoKey: Keywords
InfoValue:
InfoKey: Creator
InfoValue:
InfoKey: ModDate
InfoValue:
InfoKey: CreationDate
InfoValue:
InfoKey: Producer
InfoValue: Me
je modifie le fichier properties.txt avec les nouvelles informations ... puis
Le pdf doit être généré à partir d'une application d'OCR ... pas gagné que je puisse installer mon petit bordel sur un poste de cyber ... même si effectivement je pense à cette solution d'installer une machine anonyme pour générer le pdf ...
DAns l'immédiat je cherche une solution de "nettoyage" du fichier ... ça serait plus simple ...