Распознаваемое изображение может быть сильно «замусорено», т. е. содержать много лишних точек, возникших в результате сканирования документов среднего или плохого качества. Точки, близко расположенные к контурам букв, могут отрицательно сказаться на качестве распознанного текста. Чтобы уменьшить количество лишних точек, можно воспользоваться опцией Очистить от мусора. Для этого в меню Изображение выбрать пункт Очистить изображение от мусора. Если надо очистить от «мусора» отдельный блок, то в меню Изображение выбрать пункт Очистить блок от мусора.
2. Инвертировать изображение
Некоторые сканеры инвертируют изображения при сканировании (черный цвет переводят в белый, а белый в черный). Чтобы получить стандартное представление документа (черный шрифт на белом фоне) надо в меню Изображение выбрать пункт Инвертировать. Если сканируются или открываются инвертированные изображения, то перед добавлением в пакет таких изображений в группе Обработка изображений на закладке Сканирование/Открытие (меню Сервис команда Опции) надо отметить пункт Инвертировать.
3. Повернуть или зеркально отразить изображение
По умолчанию программа при распознавании определяет и корректирует ориентацию изображения автоматически. Если ориентация изображения была определена ошибочно, то на закладке Сканирование/Открытие надо снять отметку с пункта Определять ориентацию страницы (в процессе распознавания) и повернуть изображение вручную.
Чтобы повернуть изображение:
· на 90 градусов вправо – нажать кнопку или выбрать в меню Изображение пункт Повернуть по часовой стрелке;
· на 90 градусов влево – нажать кнопку или выбрать в меню Изображение пункт Повернуть против часовой стрелки;
· на 180 градусов – выбрать в меню Изображение пункт Повернуть на 180 градусов.
Чтобы зеркально отразить изображение относительно:
· горизонтальной прямой – выбрать в меню Изображение пункт Зеркально отразить относительно горизонтали;
· вертикальной прямой – выбрать в меню Изображение пункт Зеркально отразить относительно вертикали.
4. Стереть участок изображения
Если надо исключить какой-то участок текста из распознавания или на изображении имеются большие участки мусора, то можно стереть такие участки. Для этого выбрать инструмент (на панели в окне Изображение) и, нажав на левую кнопку мыши, выделить участок изображения, который надо удалить. Отпустить кнопку, выделенная часть изображения будет удалена.
5. Увеличить/Уменьшить масштаб изображения
На панели Изображение (в окне Изображение) выбрать инструмент / и щелкнуть мышью на изображении. Изображение увеличится/уменьшится в два раза. Щелкнуть правой кнопкой мыши на изображение и в локальном меню выбрать пункт Масштаб и нужный масштаб.
6. Получить информацию об изображении
Можно получить следующую информацию об открытом изображении: ширину и высоту изображения в точках; вертикальное и горизонтальное разрешение в точках на дюйм (dpi); тип изображения. Для этого щелкнуть правой кнопкой на изображение и в локальном меню выбрать пункт Свойства. В открывшемся диалоге выбрать закладку Изображение.
7. Печать изображения
Можно напечатать одно изображение, открытое в окне Изображение или несколько изображений, выделенных в окне Пакет, или все изображения. Для этого в меню Файл надо выбрать пункт Печать изображения и в открывшемся диалоге Печать установить параметры печати (принтер, количество печатаемых страниц, количество копий и т.д.).
8. Отменить последнее действие
Для отмены последнего действия на панели Стандартная нажать кнопку Отменить .
3. Анализ макета страницы
Прежде чем приступить к распознаванию, программа должна знать, какие участки изображения надо распознавать. Для этого проводится анализ макета страницы, во время которого выделяются блоки с текстом, картинки, таблицы и штрих–коды.
Анализ макета страницы может проводиться как автоматически, так и вручную. В большинстве случаев FineReader сам успешно справляется с анализом сложных страниц. Автоматический анализ производится по кнопке Распознать одновременно с распознаванием текста.
Ручное выделение блоков может понадобиться, если надо распознать часть страницы или в результате автоматического анализа блоки были выделены неправильно.
Блоки – это заключенные в рамку участки изображения. Блоки выделяют для того, чтобы указать системе, какие участки отсканированной страницы надо распознавать, и в каком порядке. Также по ним воспроизводится исходное оформление страницы. Блоки разных типов имеют различные цвета рамок. Можно изменить цвета рамок блоков, для этого на закладке Вид диалога Опции (меню Сервис команда Опции) в группе Объекты. В поле Объект выбрать нужный тип блока, а в поле Цвет – требуемый цвет.
При обработке изображений выделяют блоки следующих типов:
· зона Распознавания – блок используется для распознавания и автоматического анализа части изображения. После нажатия на кнопку Распознать выделенный блок автоматически анализируется и распознается;
· Текст – блок используется для обозначения текста. Он должен содержать только одноколоночный текст. Если внутри текста содержатся картинки, их выделяют в отдельные блоки;
· Таблица – этот блок используется для обозначения таблиц или текста, имеющего табличную структуру. При распознавании программа разбивает данный блок на строки и столбцы и формирует табличную структуру. В выходном тексте данный блок передается таблицей. Можно выделить и отредактировать таблицу вручную;
· Картинка – этот блок используется для обозначения картинок. Он может содержать картинку или любую другую часть текста, которую надо передать в распознанный текст в качестве картинки;
· Штрих–код – этот блок используется для распознавания штрих–кодов. Т.е., если документ содержит штрих–код и его надо передать не картинкой, а перевести его в последовательность букв и цифр, то выделить штрих–код в отдельный блок и присвоить ему тип Штрих–код.