Система автоматического реферирования, аннотирования текста
Машинный перевод текста
Система понимания письменных текстов
Система порождения письменных текстов
Система распознавания устной речи
Синтез устной речи
Система автоматического чтения текста. Для быстрого и качественного вода текстовой инфы ПК широко используется сканер – работает по принципу фотоаппарата, позволяя ПК «увидеть» текст. Для того, чтобы преобразовать графическое изображение в текстовую форму необходимы системы автоматического чтения текста или система оптического распознавания символов (OCR – Optical Character Recognition)
Система автоматического чтения текста – компьютерная программа, позволяющая преобразовать текст бумажного носителя в электронный текстовый файл.
Система OCR - это частная задача машинного зрения. К этому классу задач также относятся и задачи распознавания образов, объектов (распознавание фальшивых денег, идентификация человека)
Принципы работы OCR системы:
1. целостность – объект описывается как целое с помощью значимых элементов и отношений между ними.
2. целенаправленность – распознавание строится как процесс выдвижения и целенаправленной проверки гипотез
3. адаптивность – способность компьютерной системы к самообучению
Этапы работы Fine Reader:
1. сканирование – получение графического образа документа
2. распознавание – а) анализ графического макета страницы (выделение областей для распознавания: таблиц, картинок, текстов)
б) распознавание каждого символа на основе различных форм распознавания
Проверка орфографии