+++ to secure your transactions use the Bitcoin Mixer Service +++

 

MenuContactForumDonEnglishDeutsch

Comparatif des performances de
diff�rentes m�thodes de compression de fichiers

M�thodologie

���Les r�sultats pr�sent�s ont �t� obtenus le m�me jour sur les m�mes dossiers d'un m�me ordinateur et sont donc parfaitement comparables. Pour la circonstance, j'ai cr�� treize dossiers comportant chacun quelque cinq m�gaoctets de fichiers d'un type courant. Chaque fois que c'�tait possible, j'ai param�tr� la compression de fa�on la plus puissante (archive solide, taux de compression maximal, etc.).
��� En toute logique, la dur�e n�cessaire pour cr�er l'archive est d'autant plus longue que la compression est puissante. Toutefois, le facteur temps n'a pas �t� pris en compte, d'autant que la dur�e de d�compression d�pend peu de la m�thode � en tout cas, pas de fa�on r�dhibitoire � et que les m�thodes de compression les plus �volu�es peuvent se param�trer�: ainsi, la m�thode 7z propose trois algorithmes � LHMA, PPMD et Bzip2 � et six niveaux de compression � ��aucune compression��, ��le plus rapide��, ��rapide��, ��normale��, ��maximum�� et ��ultra�� �, ce qui permet d'adapter la m�thode selon la rapidit� et la puissance souhait�es. En outre, l'asym�trie de la m�thode rend la d�compression beaucoup plus rapide que la compression, ce qui constitue un avantage lorsque les postes clients n'ont pas la puissance d'un serveur.

R�sultats

���Pour attribuer une note globale, j'ai utilis� une m�thode non param�trique bas�e sur les rangs � de 1, pour la meilleure m�thode, � 20, pour la plus mauvaise � obtenus par chaque type d'archivage pour chacun des treize dossiers, de sorte que la m�thode la mieux not�e est celle qui est le plus souvent la mieux class�e. Ce proc�d� est plus fid�le que celui utilisant la moyenne et l'�cart-type, tout simplement parce que les donn�es que vous avez � archiver ne sont pas r�parties de la m�me fa�on que celles que j'ai utilis�es pour ce test, ni qualitativement, ni quantitativement.

Types*.avi*.dll*.doc*.exe*.gif*.htm*.jpg*.mp3*.mpg*.pdf*.txt*.wav*.zipNote /20TOTAL
Nombre de fichiers16�26138242467944298368119�674
Taille brute5�261�152�5�254�2205�254�6565�254�0565�246�2095�261�1875�246�1165�250�4325�257�7205�257�8765�253�4365�256�0245�262�68068�315�764
7z4�524�067 (2)1�543�179 (3)147�690 (3)3�910�541 (3)4�620�354 (1)341�996 (4)4�770�061 (4)5�053�813 (2)4�879�067 (5)4�258�863 (3)1�270�884 (3)3�670�225 (5)5�226�742 (14)1644�217�482
arj4�696�659 (9)2�160�530 (15)1�018�050 (17)4�130�505 (11)4�702�449 (12)898�370 (17)4�803�740 (11)5�108�093 (17)4�910�699 (16)4�606�736 (15)1�875�329 (16)4�450�535 (12)5�223�905 (13)6,148�585�600
bh4�703�291 (12)2�156�986 (12)1�010�284 (15)4�128�594 (9)4�693�021 (9)889�650 (15)4�806�914 (13)5�105�811 (13)4�904�209 (11)4�601�545 (13)1�848�972 (13)4�451�648 (15)5�201�639 (4)7,548�502�564
bz24�720�926 (18)2�095�832 (7)573�721 (5)4�273�885 (18)4�896�084 (18)645�243 (5)4�743�918 (2)5�069�593 (4)4�888�293 (7)4�444�829 (5)1�531�448 (6)3�771�508 (7)5�238�677 (16)11,746�893�957
bza4�639�340 (6)2�166�940 (17)987�806 (11)4�231�254 (17)4�878�327 (17)783�188 (8)4�787�973 (7)5�076�189 (5)4�873�810 (2)4�618�970 (17)1�516�326 (5)3�770�938 (6)5�227�572 (15)9,847�558�633
cab4�701�113 (11)2�148�386 (10)893�796 (7)4�127�044 (8)4�678�810 (5)842�129 (10)4�798�500 (8)5�099�787 (8)4�900�314 (10)4�584�969 (8)1�846�233 (12)4�451�857 (18)5�201�717 (5)10,848�274�655
gza4�703�371 (13)2�157�116 (13)1�001�990 (13)4�126�436 (7)4�693�136 (10)874�444 (12)4�803�739 (10)5�105�765 (12)4�904�249 (12)4�597�720 (11)1�840�188 (11)4�451�638 (14)5�201�436 (3)9,248�461�228
j4�678�506 (8)1�914�777 (5)703�722 (6)4�057�445 (5)4�681�437 (6)691�916 (6)4�805�059 (12)5�092�070 (7)4�898�847 (8)4�326�394 (4)1�629�228 (8)3�594�954 (4)5�215�150 (12)1346�289�505
jar4�704�088 (14)2�158�273 (14)1�017�205 (16)4�129�816 (10)4�705�456 (13)893�622 (16)4�809�136 (16)5�107�254 (15)4�904�615 (13)4�603�367 (14)1�849�394 (14)4�451�718 (16)5�202�611 (8)6,248�536�555
lha4�711�090 (16)2�215�476 (18)1�020�194 (18)4�204�071 (15)4�830�501 (15)913�845 (18)4�918�792 (19)5�206�933 (19)5�066�716 (19)4�802�049 (19)1�895�771 (17)4�447�253 (10)5�263�136 (18)6,749�495�827
lzh4�711�090 (16)2�215�476 (18)1�066�340 (19)4�143�461 (14)4�819�157 (14)971�166 (19)4�816�349 (18)5�107�584 (16)4�924�974 (18)4�635�416 (18)1�945�961 (19)4�449�756 (11)5�212�837 (11)5,349�019�567
pkz4�899�083 (20)2�354�373 (20)1�173�097 (20)4�401�289 (20)5�120�590 (19)1�018�250 (20)5�162�114 (20)5�253�006 (20)5�203�747 (20)5�076�577 (20)2�084�290 (20)5�027�854 (20)5�264�213 (19)0,252�038�483
rar4�634�009 (5)1�693�150 (4)173�313 (4)3�948�241 (4)4�639�881 (4)318�269 (3)4�780�095 (6)5�081�085 (6)4�887�973 (6)4�258�775 (2)1�318�381 (4)2�657�731 (3)5�202�579 (7)15,543�593�482
rk4�589�894 (3)1�474�339 (2)132�629 (1)3�866�814 (1)4�628�017 (3)257�588 (1)4�434�701 (1)5�017�545 (1)4�787�286 (1)4�498�992 (6)1�168�720 (1)1�659�771 (1)5�183�337 (1)18,241�699�633
rs4�625�725 (4)2�137�145 (9)937�954 (10)4�221�864 (16)4�850�493 (16)768�711 (7)4�776�635 (5)5�066�886 (3)4�878�852 (3)4�612�537 (16)1�560�879 (7)3�804�335 (8)5�240�116 (17)10,747�482�132
sqx4�662�560 (7)2�078�866 (6)991�992 (12)4�105�933 (6)4�699�518 (11)878�469 (14)4�808�697 (15)5�102�452 (10)4�908�341 (14)4�590�245 (10)1�836�245 (9)4�415�575 (9)5�208�275 (10)9,848�287�168
tgz4�707�481 (15)2�165�409 (16)907�006 (8)4�133�949 (12)4�684�949 (7)861�638 (11)4�807�701 (14)5�105�913 (14)4�909�789 (15)4�588�822 (9)1�853�650 (15)4�451�792 (17)5�202�392 (6)7,848�380�491
uha4�498�275 (1)1�474�005 (1)136�880 (2)3�879�360 (2)4�625�014 (2)284�363 (2)4�760�572 (3)5�104�837 (11)4�879�047 (4)4�237�400 (1)1�233�812 (2)2�435�124 (2)5�187�408 (2)17,344�736�097
yz14�814�935 (19)2�128�899 (8)924�706 (9)4�279�162 (19)4�686�669 (8)804�198 (9)4�810�966 (17)5�124�596 (18)4�922�886 (17)4�568�274 (7)1�901�300 (18)4�561�179 (19)5�207�874 (9)6,448�735�644
zip4�701�064 (10)2�155�923 (11)1�009�814 (14)4�135�619 (13)5�270�565 (20)877�679 (13)4�799�508 (9)5�101�205 (9)4�898�961 (9)4�599�883 (12)1�839�080 (10)4�450�719 (13)5�264�564 (20)7,549�104�584
Taille compress�e m�diane4�701�0892�152�155962�880�4�130�1604�696�327�851�8844�803�7405�103�6454�902�2624�593�9831�839�6344�448�5055�210�55648�519�559
Taux de compression m�dian10,6�%59,0�%81,7�%21,4�%10,5�%83,8�%8,4�%2,8�%6,8�%12,6�%65,0�%15,4�%1,0�%29,0�%

Efficacit�

���Les fichiers binaires � tels les programmes (com, dll, exe...), les flux audios ou vid�os compress�s (avi, mpeg...) ou les archives d�j� compress�es (cab, odt, rar, sxw, zip...) � se compressent plus ou moins mal�; les fichiers de type texte (css, htm, js, ini, log, txt...) ou ceux qui sont pleins de vide (doc...) se compressent g�n�ralement tr�s bien. Sur l'ensemble des donn�es, le taux de compression m�dian est de 29�%.
���On distingue deux populations de formats de compression. Quatre formats sont nettement plus performants, avec un taux de compression sup�rieur d'environ 20�% � celui des autres�: rk, uha, 7z et rar.

  • Les plus puissantes m�thodes de compression�:
    ���La compression rk offre des performances exceptionnelles (18,2/20) et constitue la r�f�rence sans rivale de ce comparatif (en fait, il existe une m�thode, confidentielle et en ligne de commande seulement, plus puissante encore, mais sa lenteur la rend pratiquement inutilisable). Suivent uha, 7z et rar (17,3, 16,0 et 15,5/20). Le r�sultat de 7z est d�grad� par sa mauvaise performance (14e) pour compresser les fichiers zip, bien que ceci m�rite d'�tre relativis�: la taille de l'archive 7z p�se 5�226�742, soit seulement 0,8�% de plus que la taille de l'archive cr��e par la m�thode la plus performante (5�183�337)...

  • Les bonnes m�thodes de compression�:
    ���Vient ensuite la compression jar (.j), dont la note (13/20) permet de souligner que la rusticit� n'est pas incompatible avec la performance. Suivent les compressions bzip 2, cabinet, raw (bz2, cab, rs), aux performances honorables (environ 11/20). Notez toutefois que la compression raw ne permet pas d'archiver r�cursivement des dossiers (ce que ferait un tar.rs, � l'instar d'un tar.gz)..

  • Les autres m�thodes de compression�:
    ���Parmi les m�thodes peu performantes, zip se classe 14e (7,5/20), avec seulement 5,6�% d'am�lioration par rapport � la compression zip de 1990 (pkz)�! Il est piquant de constater qu'elle est la moins efficace pour compresser des fichiers zip�: les informations de l'archivage s'ajoutant aux fichiers, qui sont simplement stock�s, l'archive a une taille sup�rieure � la taille des fichiers � compresser�!

Portabilit�

���Certains types d'archive peuvent �tre lus par de nombreux logiciels�; d'autres restent confidentiels�:

Nombre de logiciels fonctionnant sous Windows pouvant �tre associ�s au format (sur neuf)
0j (1)
1akp, aks, bhx, c2d, cdi, fea, fzs, gca hog, hqx, imp, ize, lib, mbf, mdf, ntx, pae, pb5, pdi, qwk, rep, rk, rs, sqx, uha, uzb, uze, wad, yz1
2001, a, bin, bz, bza, cpio, deb, ear, gza, ha, img, nrg, tz, wal, wsz, xpi
3rpm, tbz, tbz2, war
4b64, bh, enc, mim, taz, uu, zoo
5arc, lha, iso, pak, pk3
67z, xxe
7ace, bz2, jar, tgz, uue
8arj, cab, lzh, rar, z
9gz, tar, zip
(1) ce format est lisible par Jar (Jar32), logiciel ne fonctionnant qu'en ligne de commande (mais utilisable sous Windows).

���Les types lisibles par tous les logiciels sont gz, tar, zip. Si vous souhaitez diffuser facilement vos archives ou pouvoir les utiliser partout � par exemple, sur une clef USB �, il est donc plus judicieux de les compresser en zip qu'en j... � l'inverse, vous pouvez pr�f�rer un type peu r�pandu afin d'assurer une plus grande discr�tion de vos donn�es. Dans ce cas, les formats j puis rk, rs, sqx, uha, yz1 sont pr�f�rables. Notez que la m�thode 7z, encore confidentielle en 2005, est d�j� adopt�e par les deux-tiers des logiciels, en raison de ses grandes qualit�s et de la politique de diffusion libre choisie par son auteur, Igor Pavlov.

Conclusion

���Si vous devez compresser des donn�es tr�s vari�es, utilisez les algorithmes globalement les plus performants�: rk, uha, 7z, voire rar.
���Si vous avez � compresser une grande masse de donn�es d'un m�me type, optez pour le format de compression le plus performant pour ledit type�: par exemple 7z pour archiver des images gif.
���Le choix de la m�thode la plus adapt�e peut ensuite se d�cider, par exemple, selon la portabilit� des archives ainsi cr��es, la simplicit� du logiciel utilis� ou son co�t. Pour ce faire, je vous propose de consulter mon �tude suivante�:

Comparaison de diff�rents logiciels de compression (Windows)

Airelle

[ Retour ]