Peut-on créer un logiciel de compression illimitée ?

Question

Bonjour,*

Quelques bases :

WinZip ( ou équivalent ) marchent bien avec des fichiers hétérogènes ( genre fichiers texte ) , mais pas avec des fichiers homogènes ( genre archives ou MP3, mpeg etc )

Et aussi WinZip compresse en une seule fois ;

Donc, l'idée serait de transformer un fichier WinZip ( homogène ) en fichier heterogène ( recompressible )

Merci d'avance.*

** Éléments basiques de politesse ajoutés par la Modération CCM

fabul · Answer

Bonjour,

La plus grande compression de fichier déjà compressés (JPG etc.) que je connaisse est paq8px sur le forum encode.su

Ça a surement du être étudié déjà, mais bonne chance pour découvrir mieux.

@+

PierrotLeFou · Answer

À explorer:
https://openclassrooms.com/forum/sujet/rotation-a-90-dun-arbre-binaire
Peut-être construire un arbre binaire balancé sous forme de tableau.

BoucDelicat71 · Answer

En fait j' ai bien une idée, mais je n'arrive pas à la programmer ( ni même si elle est viable ) .

Voilà la théorie :

On ouvre un fichier WinZip en entrée ;

On ouvre un fichier virtuel à base de 0 et de 1 en sortie ;

On ouvre un fichier en sortie ;

On trie les valeurs ( de 0 à 255 ) du fichier d'entrée par ordre de la plus fréquente à la moins fréquente ;

On commence à rechercher les occurrences de la valeur la plus fréquente actuellement ( d'abord la plus fréquente, puis la deuxième fréquente etc )

À chaque fois qu'on trouve une occurrence, on cherche si, entre la précédente occurrence et celle-ci il y a un ( ou plusieurs ) bit set dans le fichier virtuel ; après quoi on publie dans le fichier de sortie la soustraction​​​​​​​​​​​​ entre les deux occurrences, moins le nombre de bits set, puis on place un bit set a l'endroit du fichier virtuel qui correspond à l'endroit du fichier d'entrée, et on recherche la prochaine occurrence...

J' espère que c'est lisible et vous souhaite une bonne lecture :)

yg_be · Answer

bonjour, on ne peut comprimer de façon illimitée.

Une des limites de la compression, c'est que, afin de pouvoir décompresser, il faut éviter que deux fichiers différents aboutissent à deux fichiers compressés identiques.

Les fichiers compressés doivent donc être au moins aussi nombreux que les fichiers de départ.  Pour être nombreux, ils doivent donc être suffisamment grands.

BoucDelicat71 · Answer

... Bon après midi ; voilà la suite de mes réflexions :'

L'idée derrière le fichier virtuel, c'est que au fur et à mesure qu'il se remplit de 1, les distances entre deux occurrences d'une même valeur vont avoir tendance à diminuer, et ceci devrait produire plus de petites valeurs au sein du fichier de sortie ( là encore je ne suis pas sûr d'être bien clair... )

Voilà ; si vous pouviez m'indiquer les zones d'ombres dans mes posts je vous remercie d'avance en vous souhaitant un bon après midi :)

PierrotLeFou · Answer

Peut-être regarder ceci?

https://fr.wikibooks.org/wiki/Compression_de_donn%C3%A9es/Techniques_de_compression_sans_perte

PierrotLeFou · Answer

Programmes ton algo et celui de la décompression.

Si tu retrouves le fichier original, alors bravo!

PierrotLeFou · Answer

Il y a longtemps, j'avais essayé de compresser des fichiers avec gzip option maximale (option 9 je crois).
Ensuite, j'essayais de compresser les fichiers compressés. J'obtenais toujours quelque chose de plus gros.
Même en combinant deux méthodes comme gzip suivi de hoffman ou inversement, je ne crois pas qu'on pourrait aller trèes loin.

mamiemando · Answer

Bonjour,

Pour répondre à la question initiale, on ne peut pas indéfiniment compresser, c'est un résultat en théorie de l'information (voir entropie au sens de Shannon).

Sans entrer dans les détails mathématiques (car il s'agit d'une branche complète de l'informatique théorique), l'entropie décrit la quantité d'information correspond à la quantité d'information contenue ou fournie par une source d'information.

Cela signifie que pour toute information, si tu envisages une compression sans perte, l'entropie montre qu'il existe une borne inférieure en nombre de bits pour compresser un fichier sans perte.

Intuitivement, s'il était possible de compresser indéfiniment une suite arbitraire de bits, cela signifierait qu'on peut réduire toute information à un seul bit. Or un bit encode au plus deux information (vrai ou faux) ce qui est évidemment insuffisant.

C'est un peu derrière cette idée qu'a été imaginé le score (fictif) de Weissman dans la série HBO Silicon Valley ;-)

Bonne chance

Peut-on créer un logiciel de compression illimitée ?

9 réponses

Votre réponse

Newsletters