Задача распознавания образов - это задача отнесения исходных данных к определенному классу с помощью выделения существенных признаков, характеризующих эти данные, из общей массы несущественных данных.
Распознавание образов является одной из наиболее фундаментальных проблем теории интеллектуальных систем. Кроме того, задача распознавания образов имеет огромное практическое значение. Вместо термина "распознавания" часто используется другой термин - "классификация". Эти два термина во многих случаях рассматриваются как синонимы, но не являются полностью взаимозаменяемыми. Каждый из этих терминов имеет свои сферы применения, и интерпретация обоих терминов часто зависит от специфики конкретной задачи.
Типовые постановки задач классификации
- Задача идентификации, которая заключается в том, чтобы выделить определенный конкретный объект среди ему подобных (например, узнать среди других людей свою жену).
- Отнесения объекта к тому или иному классу. Это может быть, например, задача распознавания букв или принятия решения о наличии дефекта в некоторой технической детали. Отнесения объекта к определенному классу отражает наиболее типичную проблему классификации, и, когда говорят о распознавании образов, чаще всего подразумевают именно эту проблему. Именно она рассматривается здесь в первую очередь.
- Кластерный анализ, заключающийся в разделении заданного набора объектов на классы - группы объектов, схожи между собой по тем или иным критерием. Эту задачу часто называют классификацией без учителя, поскольку, в отличие от задачи 2, классы априорно не заданы.
Проблемы распознавания легко решаются людьми, причем делается это, как правило, подсознательно. Попытки же построить искусственные системы распознавания не столь убедительны. Основная проблема заключается в том, что часто невозможно адекватно определить признаки, на основе которых следует осуществлять распознавание. Для задач, для которых такие признаки удается выделить, искусственные системы распознавания получили значительное распространение и широко используются.
Формальная постановка задачи
Распознавание образов - это отнесение исходных данных к определенному классу с помощью выделения существенных признаков, характеризующих эти данные, из общей массы несущественных данных.
При постановке задач распознавания пытаются пользоваться математическим языком, стараясь, в отличие от теории искусственных нейронных сетей, где основой является получение результата путем эксперимента, заменить эксперимент логическими рассуждениями и математическими доказательствами.
Зачастую в задачах распознавания образов рассматриваются монохромные изображения, что позволяет рассматривать изображение как функцию на плоскости. Если рассмотреть множество точек на плоскости T, где функция x ( x, y ) выражает в каждой точке изображения его характеристику - яркость, прозрачность, оптическую плотность, то такая функция является формальным записью изображения.
Множество же всех возможных функций x ( x, y ) на плоскости T - является моделью множества всех изображений X. Вводя понятие сходства между образами можно поставить задачи распознавания. Конкретный вид такой постановки сильно зависит от следующих этапов при распознавании согласно того или иного подхода.
Практическое использование
Методы распознавания образов и технические системы, реализующие эти методы, широко используемые на практике. Приведем некоторые из них.
Техническая диагностика
На производстве часто возникает проблема автоматизировать контроль качества деталей. Задача состоит в том, чтобы выявить, есть ли деталь дефектной, или нет. Если же выясняется, что деталь имеет дефект, часто нужно определить тип этого дефекта.
Медицинская диагностика
Системы распознавания часто используются в медицинской практике. Самая типичная ситуация состоит в том, что те или иные заболевания диагностируются на основе анализа кардиограмм, рентгеновских снимков и т.п.
Распознавание букв
Кроме всего прочего, эта проблема имеет большое значение для собственно компьютерных технологий. Системы распознавания букв работают вместе со сканерами - устройствами, которые используются для ввода в компьютер печатных изображений и текстов. При введении печатного текста сканер формирует лишь графическое изображение; для того, чтобы создать текстовый документ, с которым может работать текстовый редактор, необходимо узнать на этом изображении отдельные буквы (т. н. Технология OCR ). Аналогичным образом, распознавание букв является необходимым для поддержки устройств рукописного ввода. Этими устройствами, внешне похожими на обычную авторучку, часто комплектуются надпортативни компьютеры (персональные помощники). Основная цель этих устройств - заменить ввод с клавиатуры, что является неудобным для многих пользователей.
Распознавание речи
Сегодня интенсивно развиваются технологии, связанные, во-первых, с голосовым управлением компьютером, а во-вторых - с введением текстов с голоса. Робототехника.Применение методов распознавания в робототехнике является абсолютно естественным и необходимым, поскольку работы должны непосредственно воспринимать внешний мир, и, соответственно, иметь устройства машинного зрения.
Охранные системы
Применение методов распознавания в охранных системах связано в первую очередь с проблемой идентификации. Например, нужно идентифицировать некоторую личность, чтобы определить, имеет ли она право входить на территорию охраняемого объекта.
Развиваются также системы, которые решают проблему идентификации отпечатков пальцев и т.п.