LINUX.ORG.RU
 
question4

Какой архиватор сейчас самый быстрый?


0

2

Сабж. Давно не следил за их развитием. Существует ли сейчас что-либо существенно быстрее, чем 7-zip, работающий с архивами ZIP? 32-разрядные.

Скорость упаковки важна, скорость распаковки важнее. Степень сжатия не особо важна. Поэтому я счёл формат ZIP целесообразнее 7Z.

Если интересны подробности. Нужно сжимать-разжимать образы виртуальных машин VMware. Объём -- от 3 до 30 гигабайт. Пользоваться снапшотами или другим эмулятором нет возможности.

Естественно, желательны открыто-свободные программы. Или хотя бы как unrar.

Помнится, какой-то автор хвастался своим распаковщиком, который распаковывал файл быстрее, чем шло копирование несжатого файла -- за счёт меньшего времени на чтение с диска. Такой существует?

Заранее спасибо.


[#] Ответ на: комментарий от anTaRes 26.10.2011 18:53:53  
anTaRes

+ минитест (1000M .img, 2x core):

$ time lzma -1 Linux.img 
real	0m29.077s
user	0m27.831s
sys	0m1.191s

$ time lzma -d Linux.img.lzma 
real	0m3.964s
user	0m3.945s
sys	0m0.004s

$ time pbzip2 -1 Linux.img 
real	0m15.728s
user	0m26.561s
sys	0m2.087s

$ time pbunzip2 Linux.img.bz2 
real	0m24.031s
user	0m6.023s
sys	0m1.549s

* ()
[#]  
nu11

>Поэтому я счёл формат ZIP целесообразнее 7Z.

так это ж контейнеры, все едино. Я недавно дампы баз сжимал методом LZMA и засовывал в zip. Скорость сжатия на третьей степени намного выше обычного deflate (тот самый, который в обычном зипе со времен pkzip), при этом сжимается лучше. Скорость распаковки не измерял, мне было важнее, чтоб открывалось даже голой вендой :)

А так можешь взять 7z в руки да проверить на одном своем файле. Контейнеров и методов сжатия не так и много.

***** ()
[#]  
firestarter

Re: Какой архиватор сейчас самый быстрый?

tar

> Степень сжатия не особо важна.


Тем более. А за сжатием вообще обращаться к компрессорам.

*** ()
[#] Ответ на: комментарий от anTaRes 26.10.2011 19:25:51  
question4

> минитест

Спасибо. Надеюсь, Linux.img — несжатый? :)

Насколько я помню, LZMA — 1-поточный. Даже если его научились распараллеливать, в программе lzma была старая версия алгоритма.

То есть 1-поточный LZMA сжимает на проценты медленнее, чем 2-поточный bzip2. А распаковывает вдвое быстрее.

Насколько я знаю deflate (в zip/gzip) — ещё быстрее LZMA.

То есть про pbzip2 можно не вспоминать.

**** ()
[#] Ответ на: комментарий от nu11 26.10.2011 20:20:53  
question4

> так это ж контейнеры, все едино

Я имел в виду методы, используемые в этих контейнерах по умолчанию. LZMA для 7z и deflate для zip.

> Скорость сжатия на третьей степени

Это как? «7z -mx=3» ?

> намного выше обычного deflate (тот самый, который в обычном зипе со времен pkzip), при этом сжимается лучше.

Попробую, спасибо. Но для «7z -tzip -mx=1», вроде получилось медленне, чем с «7z -tzip -mx=1» при несущественном выигрыше в сжатии.

> Скорость распаковки не измерял, мне было важнее, чтоб открывалось даже голой вендой :)

Достаточно взять версию 7-zip не ниже :)

> А так можешь взять 7z в руки да проверить на одном своем файле.

С -mx=1 сжимается полчаса.

**** ()
[#] Ответ на: Re: Какой архиватор сейчас самый быстрый? от firestarter 26.10.2011 21:10:17  
question4

Re: Какой архиватор сейчас самый быстрый?

> tar ... А за сжатием вообще обращаться к компрессорам.

Где взять патчи для tar-а для поддержки компрессоров pigz, lzop и snappy? ОС с кривой реализацией пайпов, tar чтототам | gzip работает через раз.

**** ()
[#] Ответ на: комментарий от anonymous 26.10.2011 21:26:11  
question4

> http://exdupe.com/

Нет 32-битной версии.

К тому же закрытый. И ни одного стороннего отзыва в интернете не нашёл.

И возникают подозрения: зачем архиватору доступ к IPX, AppleTalk и /proc/net ?

> http://maximumcompression.com/data/summary_mf4.php

Автору нравится FreeARC :) Snappy в списке нет. Но в остальном хорошая таблица.

> http://extrememoderate.wordpress.com/2011/08/20/synthetic-test-of-filesystem-com...

Довольно специфическая задача. Но хотя бы показывает соотношение Snappy-LZO. Спасибо.

**** ()
[#] Ответ на: комментарий от shty 27.10.2011 0:39:13  
question4

> tar?

Есть сильные подозрения, что что-нибудь быстро сжимающее и разжимающее (на основе LZO?) обработает большой объём хорошо сжимаемых данных быстрее. Будет меньше работы с диском.

**** ()
[#] Ответ на: комментарий от shty 27.10.2011 0:46:19  
question4

>>скорость распаковки важнее

> так что быстрее не будет

Да, время записи больше времени чтения, но оно одинаково. Время чтения сжатого архива всегда будет меньше времени чтения несжатого тарболла. Вопрос в том, какие распаковщики настолько быстро работают, чтобы почувствовать разницу, сжимая-распаковывая исполнимые файлы.

**** ()
[#] Ответ на: комментарий от post-factum 27.10.2011 1:22:57  
question4

> xz, например.

Никаких преимуществ перед LZMA из свежего 7-zip. Кроме сохранения атрибутов, которые в данном случае не играют роли, т.к. по умолчанию. И долго работает.

**** ()
[#] Ответ на: комментарий от question4 27.10.2011 0:12:18  
anTaRes

>> 2002 год. Поновее нету?

алгоритмы обычно не меняются, даже если со временем изменились цифры - общее соотношение осталось прежним

вот, к примеру, я еще с конца 90х помню что rar сжимает текст лучше чем zip
и я даже проверять не буду, уверен за 10 лет ничего не изменилось

>>Спасибо. Надеюсь, Linux.img — несжатый? :)

это образ какой-то вм, qemu чтоль
зх как там с сжатием, но уверен там много нулей ;)

* ()
[#] Ответ на: комментарий от anTaRes 27.10.2011 3:22:58  
question4

> >> 2002 год. Поновее нету?

> алгоритмы обычно не меняются,

Неверно.

Кроме того, конкретные реализации важнее.

> даже если со временем изменились цифры - общее соотношение осталось прежним

Опять неверно.

> вот, к примеру, я еще с конца 90х помню что rar сжимает текст лучше чем zip и я даже проверять не буду, уверен за 10 лет ничего не изменилось

Учитывая, что zip не развивается с середины 1990-х, неудивительно. А вот про реализацию deflate в 7-zip я бы не был не столь уверен :)

Ещё контрпример: 15 лет назад rar уступал ha. Сейчас превосходит.

>> Linux.img

> это образ какой-то вм,

Так и запишем, с ядром линукса anTaRes не знаком :)

**** ()
[#] Ответ на: комментарий от question4 27.10.2011 9:51:37  
anTaRes

>> Так и запишем, с ядром линукса anTaRes не знаком :)

ядро тут не причем , это образ виртуалки
а что там внутри - хз, возможно она вообще пустая :)
но Вам же образы и сжимать, ткчто они тоже не всегда на 100% заполнены будут
и даже со степенью сжатия "1" можно будет раз в 5-10 ужать

вобшшем как определитесь - обнародуйте свое решение ;) интересно будет узнать что выбрали и почему

* ()
[#] Ответ на: комментарий от question4 27.10.2011 0:12:50  
nu11

>Это как? «7z -mx=3» ?
угу

>Но для «7z -tzip -mx=1», вроде получилось медленне, чем с «7z -tzip -mx=1» при несущественном выигрыше в сжатии.

не понял, что с чем сравниваешь :) Deflate тормоз изначально, при этом ЕМНИП работает только в один поток

>Достаточно взять версию 7-zip не ниже :)

неа, в том и фишка, что открывается без сторонних приблуд

>С -mx=1 сжимается полчаса.

так отрежь от него кусок небольшой для теста

***** ()