Текстовый формат RTF попал сюда за свои неординарные способности к переносу текстов из одной программы в другую. Он позволяет передавать форматированный текст из программ оптического распознавания символов или текстовых редакторов в графические программы или в любых других направлениях. RTF может оказаться хорошим решением (а, иногда, и единственным выходом) при переброске между программами.
Секрет совместимости заключается в использовании специальных тегов форматирования RTF и Unicode. Именно Unicode (использованный как основа формата Microsoft Word 97/98 для Макинтош и PC) позволяет легко переносить русские тексты с PC на Мак и обратно в файлах MS Word 97/98 (верно и для более высоких версий Word’а).
RTF используется как основной в поставляемом вместе с Mac OS X редакторе TextEdit и в прилагаемом к Windows программе WordPad.
SWF
Adobe Flash Shockwave File, SWF
DWG
AutoCAD Drawing, DWG
SVG
Scalable Vector Graphics, SVG
EMF
Enchanced Metafile, EMF
DJVU
Графический формат DJVU (произносится Дежавю) разработан фирмой AT&T в первую очередь для размещения в Интернет отсканированных изображений. Это могут быть книги, рукописи, географические карты, художественно оформленные меню ресторанов и многое многое другое. Его уникальной особенностью является черезвычайная компактность при хранении изображений в высоком разрешении (300 DPI и выше). На одной дискете можно разместить до двадцати страниц пригодных для распечатывания на лазерном принтере. Кроме того, этот формат оптимизирован для передачи по сети таким образом, что страницу можно просматривать еще до завершения скачивания. Таким образом DJVU является уникальным инструментом для открытия Интернет-доступа к фондам обычных, бумажных библиотек.
Отдельно следует упомянуть законность публикации библиотекой отсканированного текста. Многие издательства протестуют против публикации отсканированных и преобразованных в текстовый формат книг, но, в тоже время, согласны с ксерокопированием или микрофильмированием по заказу читателей библотек. Скорее всего, юридическое решение проблемы еще является делом будущего.
В основе формата DJVU лежат несколько технологий разработанных в AT&T Labs.
алгоритм отделения текста от фона на отсканированном изображении
Первые четыре алгоритма обеспечивают черезвычайно высокую степень сжатия. Типичным является преобразование tiff файла размером 25МБ (формат А4 отсканированный на цветном сканере 300DPI) в DJVU файл размером 80КБ, без видимой на глаз потери качества. Для черно-белого изображения, размер DJVU файла может получиться еще меньше - примерно 30КБ. Возможно дальнейшее повышение коэффициента сжатия,вплоть до отношения 1000:1, правда потеря качества становится довольно заметной. Таким образом, на стандартную дискету 1.4МБ можно разместить 15-20 изображений высокого качества. Дополнительно заметим, что искажения вносимые вейвлетным сжатием существенно менее заметны по сравнению с искажениями в JPEG файлах.
Алгоритмы распаковки позволяют показать часть изображения, не разворачивая всю картинку в оперативной памяти, а также легко масштабировать изображение. Это позволяет быстро просмотреть файл даже на относительно слабой машине. Еще одной интересной особенностью алгоритмов распаковки является инкрементальное восстановление изображения. При просмотре через Интернет вначале выводится только текст, затем фон в низком разрешении и только потом фон в высоком разрешении. Это позволяет быстро оценить документ, не скачивая его полностью.
И, наконец, отделение текста от фона чрезвычайно повышает его разборчивость, особенно, если текст напечатан на цветной бумаге или расположен поверх рисунка. Возможен и отдельный просмотр фона, причем алгоритм "маскировки" восстанавливает те части фона, которые были закрыты текстом.
Изображения не содержащие текста могут быть преобразованы в формат IW4, который соответствует части формата DJVU ответственной за хранение фона.
В начале 1999 года фирма AT&T объявила о дальнейшем развитии формата - DJVU 2.0 В новой версии предусмотрено объединение нескольких изображений в один файл, с возможностью "перелистывания" страниц, а также нанесени на изображение так называемых "горячих точек", участков изображения служащих гиперссылками.
Следует помнить, что алгоритмы заложенные в DJVU оптимизированы для изображений отсканированных с высоким разрешением. Если у вас есть картинка 320x200 или 800x600 то вас вполне удовлетворит JPEG или GIF. Оптимальными для сжатия DJVU являются картинки отсканированные на 300 DPI и выше. Для рисунков отсканированных на 100-200 DPI предусмотрен режим предварительного растягивания со сглаживанием для повышения качества результирующего изображения. Также необходимо заметить, что процесс сжатия, в противоположность к воспроизведению, достаточно критичен к свободной оперативной памяти.