Другие языки программирования и технологии

Архивация, Сравнение размеров

Сравните размер архива TextAndPict.7z (.rar, .zip) и суммарный размер
архивов TextArchive.7z (.rar, .zip) и PictureArchive.7z (.rar, .zip). Попробуйте
объяснить полученный результат.
RB
Rustam Bedel
196
Ты правда думаешь, что у каждого на компьютере есть файлы с таким названием, и что они по всей Вселенной содержат одно и то же? Кроме тебя и твоего преподавателя, никто и в душе не знает, что это за файлы, и какие у них размеры.

А так, на уровне общих принципов:
  • Текст жмётся хорошо, занимает в архиве 10-20% от полного размера.
  • Картинки в некомпрессированном формате (BMP) жмутся средненько, т.к. меньше паттернов, которые можно было бы запихнуть в словарь без потери качества. Лучше жмутся искусственные изображения, такие как схемы, диаграммы, рисунки (т.к. они содержат большие участки одного цвета). Хуже жмутся естественные изображения, например, фото (т.к. в реальном мире господствует интерференция, и не существует протяжённых участков одного и того же цвета, но цвета соседних точек обычно расположены по градиенту).
  • Картинки в компрессированных форматах (GIF, JPEG, PNG) вообще не жмутся, так как эти форматы специально разработаны для устранения избыточности хранимых данных, и такие файлы даже могут в архиве занимать больше места, чем вне архива.
  • Упаковка текста и картинок в один и тот же архив не даёт экономии, так как паттерны в тексте и архивах разные, и общих элементов в словаре не будет. Упаковка однородных данных (тексты или изображения) в один архив даёт дополнительную экономию по сравнению с размещением тех же данных в раздельных архивах.
Константин Порфирьев
Константин Порфирьев
54 053
Лучший ответ
текст лучше паковать в два захода - .tar.bz2
это дают наилучшую компрессию на сегодня
так жмут исходники