Методические указания к выполнению лабораторной работы
по дисциплине
«Вычислительные машины, системы и сети»
Ростов-на-Дону
Составители: асп. С.В. Носачёв
Н.Е. Чистяков
Методические указания к лабораторной работе Архиваторы и архивация данных: по курсу «Вычислительные машины, системы и сети». - Ростов н/Д: Издательский центр ДГТУ 2010. 8с.
Печатается по решению методической комиссии факультета «Автоматизация, мехатроника и управление»
Цель работы: ознакомление с программами архивации файлов, типами архивов, а также изучение влияния различных типов файлов на степень их сжатия.
На сегодняшний день уже сложно представить проблему переноса и хранения файлов. Работа с большим количеством файлов, объем которых в свою очередь является немалым, невозможна без программ архиваторов, позволяющих правильно организовать передачу данных.
Что такое архиватор?
Определение архиватора напрашивается само собой: архиватор - это программный продукт, позволяющий объединить несколько файлов в один архив, а также позволяющий изменять путем сжатия размер архивируемых данных.
Принцип работы архиватора, достаточно прост. Если детально рассмотреть любой файл, то можно обнаружить, что он состоит из некоторого набора нолей и единиц. Их количество и взаимное расположение зависит от того, что это за файл, однако битовая последовательность может быть рассмотрена и с точки зрения комбинаторики. Предположим, есть некоторый фрагмент данных:
Независимо от того, кто и для чего его применяет, во фрагменте наблюдается определенная закономерность. Последовательность "110" повторяется четыре раза подряд. Таким образом, появляется возможность заменить вышеуказанный фрагмент следующей последовательностью:
КЛЮЧ \ повтор \ повтор \ повтор \
Где под ключом обозначается участок 110, а символ повтора означает, что на его месте должен находиться тот ключ, что и в предыдущем. Если условно сказать, что повтор обозначается как 1, то исходный фрагмент преобразуется в:
В результате из последовательности длиной двенадцать бит получается последовательность в шесть бит. То есть применение алгоритма кодирования позволило сжать исходный файл в два раза. Иными словами идея работы архиватора состоит в отслеживании и замене повторяющихся участков кода какого-либо файла определенным ключом, за счет чего и происходит сжатие файла.
В архив можно поместить как один файл, так и несколько, причём можно заархивировать целую папку, вместе с содержащимися в ней файлами и другими папками, если они там присутствуют. Ну и, конечно, кто-то должен уметь выполнять обратную операцию: извлечение файлов из архива.
Эту процедуру выполняет распаковщик, который в подавляющем большинстве случаев объёдинён в одно целое с программой-архиватором.
Архив почти всегда содержит метаданные - данные, характеризующие или поясняющие другие данные или какую-либо информацию, например:
· Имена файлов
· Права на доступ к файлам
· Размеры файлов
· Даты изменения и создания файлов
· Контрольные суммы файлов, для проверки их целостности после распаковки
· Размер и контрольную сумму самого архива
· Данные для восстановления (если они добавлялись)
Для сжатия файлов требуется некоторое время, причём длительность архивации зависит от количества файлов и их типа, используемого алгоритма сжатия, а также от технических характеристик компьютера, на котором выполняется эта процедура, в частности, от частоты процессора, объёма оперативной памяти.
Создание архивов предназначается для длительного хранения файлов, которые используются редко, но занимают достаточно много полезного места, однако представляют ценность для пользователя и просто удалить их, чтобы высвободить пространство, нельзя. Но архивация файлов, с которыми работают каждый день, просто не имеет смысла.