LINUX.ORG.RU

Чем упаковать несколько каталогов с почти одинаковыми бинарными данными?


0

0

Здравствуйте!

Имею 10 каталогов различных веток одной и той же программы. В каталогах, помимо кода, лежат и данные - картинки, музыка. Данные не сильно отличаются между различными ветками.

Весь объем всего - 9 Gb, самая жирная ветка - 1.2 Gb. По моим прикидкам, объем архива должен получиться ~3 Gb.

При паковке через zip (v.2.32) вылезла ошибка - не может создать файл больше 2 Gb.

При паковке через tar в bz2 размер архива получился в 8 Gb, то есть, видимо паковка идет в пределах одного файла, а файлы друг с другом не сравниваются.

Вопрос - какой архиватор находит у себя в словаре одинаковые последовательности в разных файлах? Какой архиватор не ограничен размером выходного файла? Какие опции надо задать архиваторам?


>Вопрос - какой архиватор находит у себя в словаре одинаковые последовательности в разных файлах?

любой на самом деле, хотя имеет значение размер словаря и обьем буфера для компрессии.

я бы взяла p7zip ( 7z )

Sylvia ★★★★★
()

>При паковке через tar в bz2 размер архива получился в 8 Gb, то есть, видимо паковка идет в пределах одного файла, а файлы друг с другом не сравниваются.

он блочный, по 900 кб блоки сжимает (-9)

Sylvia ★★★★★
()
Ответ на: комментарий от Sylvia

Хм, щас пробую расово некошерный RAR, у него по дефолту вроде по уму для таких данных все настроено. При неудовлетворительном результате поищем p7zip.

xintrea
() автор топика
Ответ на: комментарий от xintrea

7z сортирует одинаковые файлы рядом, так что мне кажется, что он вполне успешно пожмет ваше дерево svn или что там )

Sylvia ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.