Самую большую сложность представляет перевод традиционных документов в электронный вид для последующей их обработки в ЭВМ. В настоящее время для этих целей используют клавиатуру ЭВМ, разнообразные сканеры, цифровые фотоаппараты, видеокамеры, мобильные телефоны, микрофоны.
Клавиатура служит для ввода символьных данных и управления работой ПК. Ввод содержания документов вручную с клавиатуры для подготовки и регистрации их в ЭВМ — достаточно трудоемкий и утомительный процесс, поэтому все большее применение находят сканеры и другие технические средства, автоматизирующие его.
Сканер называют глазами компьютера. Сканер — устройство, в котором с помощью лазерного луча считывается (точка за точкой переводится в цифровой вид) графическая информация (в том числе текст), которая воспринимается компьютером. Созданная в памяти компьютера совокупность точек является графической копией исходного документа. Затем с помощью специальных программ оптического распознавания символов OCR или шрифтового преобразования (например, Fine Reader российской фирмы ABBYY и CuneiForm российской фирмы Cognitive Technologies) графическую картинку текста можно перевести на естественный язык.
Основные характеристики сканера: оптическое и физическое разрешение, глубина цвета, скорость сканирования.
Разрешение — главная характеристика, чем оно выше, тем лучше. Сканирование выполняется по горизонтальным строкам, которые формируются точками. Чем больше и лучше светочувствительные элементы, тем больше точек строки сканер воспринимает, тем выше разрешение. Единицей измерения разрешения является количество точек на дюйм (dpi). Современные сканеры имеют разрешение от 600 до 1200 dpi. Но это оптическое разрешение.
Физическое разрешение сканера зависит от шага перемещения каретки сканера вдоль изображения во время считывания. Это разрешение обеспечить проще и производители часто рекламируют его.
Глубина цвета исчисляется в битах. Цветное машинное изображение строится из цветовых пятен красного, зеленого и синего цветов. Общее количество передаваемых цветов около 16 млн. Для передачи каждого цвета требуется 8 бит, для трех — 24 бита. Современные сканеры имеют разрешение 48 бит, что позволяет лучше кодировать цвета и убирать искажения.
Скорость сканирования зависит от разрешения. Чем выше разрешение, тем медленнее сканирование. Например, для ввода страницы формата А4 черно-белого текста с разрешением 200 dpi скорость сканирования будет составлять 2-40 с. Скорость сканирования зависит также от интерфейса подключения к компьютеру. Самый быстрый универсальный — USB, самый медленный принтерный — LPT.
Ручные сканеры — самый простой вид сканеров, дающий наименее качественное изображение. Они не имеют движущихся частей, и сканирование происходит путем передвижения сканера по документу. Недостатком является узкая полоса сканирования. Их используют для сканирования текстов, а для сканирования иллюстраций они не пригодны.
Листовые (протяжные) сканеры. Можно сканировать сразу весь лист целиком за один проход. Блок сканирования у таких сканеров неподвижен, а бумага проходит через сканер с помощью специальных валиков. Листовые сканеры гарантируют хорошее качество, но они предназначены для сканирования отдельных листов. Перевести с помощью этого сканера в электронную форму страницу книги или разворота журнала практически невозможно.
Планшетные сканеры обеспечивают наилучшее качество и максимальное удобство при работе с бумажными документами. Под крышкой планшетного сканера располагается прозрачное основание, на которое укладывается документ. Блок сканирования перемещается вдоль документа внутри корпуса сканера. Сегодня планшетные сканеры наиболее популярны, так как позволяют сканировать не только отдельные листы, но и переплетенные книги, журналы и т. п.
Разновидностью планшетного сканера является сканер с прозрачным корпусом, который может быть установлен вертикально, горизонтально и под углом. В этом сканере, благодаря ударопрочному поликарбонатному стеклу корпуса, хорошо видно, как заложен оригинал, и можно избежать его «косой» закладки.
Барабанные сканеры обеспечивают самое лучшее разрешение, но они предназначены не для копирования бумажных форм, а для сканирования прозрачных материалов. В сканерах этого типа сканирующая головка установлена неподвижно, а цилиндр вращается с большой скоростью, сканируя построчно.
Сканеры форм предназначены для сканирования стандартных бланков. Этот вид сканера является подвидом листового сканера (используется, например, на выборах — для бюллетеней).
Штрих-сканеры — это разновидность ручного сканера; используется для считывания штрих-кодов (например, в магазине).
В нашей стране распространение получили сканеры фирм Hewlett-Packard, Mustek и Epson.