Ущільнення файлів – це операція над файлами для отримання копій файлів, які займають менший розмір в порівнянні із початковими файлами.
Всі методи ущільнення даних можна розділити на два класи:
- з втратою інформації;
- без втрати інформації.
Ущільнення даних з втратою інформації (5-20%) застосовується для аудіо- та відеофайлів. Їх можна ущільнити в 10-15 разів (музика) або в 20-30 разів (фото- та відеоматеріали). Прикладом алгоритмів такого класу можуть служити алгоритми JPEG, MPEG.
Ущільнення даних без втрати інформації використовується для текстових та програмних файлів. Зрозуміло, що ступінь ущільнення таких файлів набагато менша (1,5-3 рази), однак є гарантія повного збереження початкової інформації. Такі методи базуються на вилученні природної надлишковості даних. До найбільш відомих алгоритмів такого класу відносяться:
- алгоритм Хафмана (символи, які найчастіше зустрічаються, мають більш короткий код);
- методи RLE (вилучення фрагментів, які повторюються);
- алгоритм Zempel-Ziv ( дуже складний, зате більш ефективний).
В Linux за останнім алгоритмом працює програма gzip.
Архівування файлів – це операція над файлами з метою отримання резервних копій файлів для довготривалого зберігання. Найпростіший метод резервного копіювання в Linux – це копіювання на резервний носій даних необхідних файлів чи каталогів за допомогою утиліти tar. Звичайно, файли можна спочатку ущільнити, а потім створити їх резервні копії.
Рекомендована література з теми 6
[2, c.125-128, 237-250, 262-275], [5, c.61-76, 338-346, 408-433],
[7, c.370-378].
Повний список літератури знаходиться на стор. 87.