3.1. Назначение, классификация и области применения
В настоящее время в различных областях науки и техники ощущается рост потребностей в переработке, анализе и отображении визуальной информации. В этом направлении принято выделять три основных типа задач: собственно обработку изображений, когда и исходные данные, и результаты обработки представляются в изобразительной форме; анализ (интерпретацию, распознавание или «понимание») изображений, когда входные данные являются изображением, а результат представляется в неизобразительной форме, например в виде текстового описания наблюдаемой сцены; синтез изображений (машинную графику), когда на входе имеется описание (алгоритм построения) изображения, а на выходе по нему строится само изображение. Взаимосвязь трех перечисленных типов задач показана на рисунок 1.
Рисунок 1. Взаимосвязь направлений цифровой обработки изображений
Обработка изображений, как уже отмечено, связана с преобразованием изобразительной информации вновь в изобразительную форму. Примером здесь может служить устранение искажений или дефектов на изображении, улучшение качества получаемой визуальной информации путем повышения контраста, подчеркивание контуров объектов и т. д.
Задачей анализа изображений является получение из изображения, поданного на вход системы, неизобразительного описания. Это описание может быть различных уровней общности — от простого указания номера или имени класса, к которому относится анализируемое изображение, до подробной характеристики наблюдаемой сцены с указанием отдельных объектов и отношений между ними. В последнем случае обычно говорят о «понимании» изображений. Некоторые авторы называют анализ изображений распознаванием, хотя, на наш взгляд, этот термин имеет более узкое значение, относясь преимущественно к идентификации отдельных объектов на изображениях. К типичным задачам анализа можно отнести распознавание рукописных или печатных знаков, дешифрацию аэрофотоснимков, анализ наблюдаемых сцен.
Синтез изображений обычно отождествляют с машинной графикой, хотя последний термин в буквальном понимании стал несколько архаичен. В настоящее время синтезируются на ЭВМ отнюдь не только «графические» картины, наоборот, синтез все больше претендует на создание полноцветных реалистических изображений по их описаниям в неизобразительной форме. Сюда относятся и системы имитации визуальной обстановки на тренажерах, и системы геометрического моделирования в САПР, и системы компьютерного киноискусства.
Наряду с этим сохраняются и традиционные приложения машинной графики: вывод информации на экран дисплея в виде диаграмм, графиков; построение чертежей и т. д. Интерактивной графикой называют направление, предполагающее не только синтез изображения ЭВМ, но и ввод пользователем в систему данных в графической форме, например, с помощью копирующего устройства, светового пера или манипулятора типа «мышь».
Системы обработки и анализа видеоданных, которые обычно работают со входной информацией в виде полутоновых или многоспектральных изображений, в нашей стране обычно объединяют под названием автоматизированных систем обработки изображений (АСОИз). В настоящее время системы, решающие достаточно сложные и «интеллектуальные» задачи анализа изображений, принято выделять в отдельный класс систем анализа изображений (САИ). Системы, задачами которых являются синтез изображений и обработка графической информации, называют системами машинной графики (СМГ); употребляется также термин «системы обработки графической информации» (СОГИ). Следует отметить, что такое деление достаточно условно и за последнее время наметилась устойчивая тенденция к сближению этих систем. Все чаще АСОИз оперируют графической информацией, решая в том числе и задачи синтеза, а СМГ применяются для построения полутоновых изображений с привлечением различных методов их обработки.
Одно из направлений наиболее широкого практического применения АСОИз — обработка результатов дистанционных исследований. Среди многочисленных развивающихся прикладных областей здесь можно упомянуть: геологию (исследование и поиск природных и ископаемых ресурсов); сельское и лесное хозяйство (обнаружение аномалий, слежение за состоянием участков, предсказание урожая); анализ состояния окружающей среды и климата; метеорологию (предсказание погоды, анализ воздушных течений и температурных полей); гидрологию и океанографию (наблюдение за водными ресурсами, течениями, распределениями температуры, планктона, льдов); картографию (составление фотографических и других карт, накопление картографических данных, территориальный анализ); слежение за объектами на земной поверхности (транспорт, судовождение и т. д.).
Быстро развивается направление обработки биомедицинских данных. Здесь АСОИз находят применение в микробиологии и цитологии (анализ снимков с микроскопов, анализы крови, хромосомный анализ), рентгенологии, ультразвукоскопии, инфраскопии (обработка двух- и трехмерных изображений внутренних органов, анализ распределения температур тела, томография), сравнительных исследованиях (идентификация отпечатков пальцев, идентификация состояний больных). Недостаточно развито пока применение АСОИз в производственных системах, однако потребности автоматизации управления и производства должны привести к быстрому росту числа применений АСОИз в таких областях, как материаловедение (обнаружение дефектов, анализ и предсказание свойств материалов, структурный анализ), сборочные работы (системы технического зрения для роботов и гибких автоматизированных производств), системы ориентации и анализа обстановки в реальном времени (для различных видов транспорта, летательных и космических аппаратов).
Основными областями применения систем машинной графики являются: автоматизация проектирования (построение чертежей, проекций, планов, двух- и трехмерных визуальных моделей деталей и объектов); дизайнерские работы в таких областях, как автомобиле- и самолетостроение, архитектура, пошив одежды; картография (составление, корректировка, хранение и генерация карт); автоматизация исследований (отображение в визуальной форме результатов экспериментов, вычерчивание графиков, гистограмм, диаграмм и т. д.); организация эффективного взаимодействия человека с ЭВМ (графические языки, интерактивная графика); синтез картин и сцен (для тренажеров самолето- и автовождения, в машинной живописи, в компьютерных играх); синтез динамических картин (компьютерная мультипликация и кинематография).
Степень «интеллектуализации» АСОИз и систем машинной графики может быть различной в зависимости от уровня представления и использования в этих системах знаний специалистов по обработке изображений и специалистов предметных областей. Она колеблется от возможности применения набора утилит (операций) обработки, анализа или синтеза изображений, которые в грубом приближении можно интерпретировать как записанные в процедурной форме знания специалистов, до поддержки специальных баз знаний в развитых экспертных системах анализа изображений.
В этой связи в настоящем разделе при последующем изложении рассматриваются системы трех классов:
— традиционные «малоинтеллектуальные» АСОИз, без понимания состава, функций и особенностей построения которых трудно представить себе уровень развития интеллектуальных систем;
— системы анализа видеоданных, основанные на знаниях, которые образуют специальный класс экспертных систем анализа изображений и которым уделено ниже преимущественное внимание;
— интеллектуальные системы машинной графики.
3.2. Автоматизированные системы обработки изображений
Исследовательские АСОИз создаются обычно как «универсальные», не привязанные жестко ни к какому классу видеоданных. В то же время данные конкретных предметных областей имеют свою специфику и особенности, что необходимо требует проблемной ориентации АСОИз, разрабатываемых для прикладных применений. Первые такие системы были специализированными, предназначенными для решения конкретных узких задач с помощью ограниченного набора алгоритмов. С развитием методов обработки изображений, удешевлением аппаратуры, появлением новых технологий и технических средств (микропроцессоров, интеллектуальных видеотерминалов, памяти большой емкости и т. п.) проявилась устойчивая тенденция к переходу от систем специализированных к системам проблемно-ориентированным, призванным решать некоторый класс задач в рамках данной предметной области.
Проблемно-ориентированные прикладные АСОИз используют, как правило, достаточно богатый арсенал различных методов и средств обработки данных, анализируют различную входную информацию, активно используют возможности человека. Поэтому в таких системах должны быть различные функциональные блоки и подсистемы, обеспечивающие не только решение собственно задач обработки изображений, но и ввод в обработку других типов данных и знаний, накопление, хранение и отображение результатов, организацию взаимодействия с пользователем и другими системами. Наличие разнородных компонентов, работающих совместно для достижения общей цели, есть признак превращения современных АСОИз в интегрированные системы. Интеграция является одной из главных тенденций развития современных АСОИз, поэтому рассмотрим ее направления и особенности более подробно.
Прежде всего, АСОИз уже нельзя рассматривать обособленно от ее окружения — средств сбора и передачи видеоданных, систем обработки и анализа данных других типов. АСОИз как элемент некой метасистемы перестает быть элементом изолированным, приобретает богатые информационные связи с другими элементами. Это интеграция внешняя. Показательным примером служит здесь японский проект создания ЭВМ пятого поколения. Согласно этому проекту система распознавания образов и изображений (наряду с системами машинного перевода, ответов на запросы, понимания специализированного языка и решения прикладных задач) является базовой в обеспечении интеллектуального интерфейса человек — ЭВМ, при этом все упомянутые системы должны работать параллельно и одновременно над единым потоком данных, дополняя друг друга. Интеграция приводит к появлению в составе АСОИз развитых средств коммуникации, подсистем накопления и хранения как исходных данных, так и промежуточных и окончательных результатов (рисунок 2).
Рисунок 2. Структура интегрированной АСОИз
Внутренняя интеграция затрагивает различные АСОИз: средства и методы обработки, сами обрабатываемые данные.
Интеграция средств обработки означает объединение в системе различных универсальных или специализированных устройств, имеющих возможность параллельной работы над данными.
Например, в системе PUMPS интегрированы процессоры обработки изображений, коммуникации и машина базы видеоданных. В других системах обработка и анализ изображений ведутся параллельно с помощью независимых специализированных процессоров, каждый из которых выполняет определенные операции: фильтрацию, вычисление площади объектов, вычисление периметра, сегментацию и т. д. Часто имеется отдельный процессор для численных расчетов, процессор внутренних обменов и процессор интерфейса. Практически все новые АСОИз снабжены развитыми средствами визуальных данных, включая полутоновые, графические и стереоскопические (трехмерные) устройства отображения.
Интеграция методов обработки означает наличие в системе функциональных подсистем и обрабатывающих алгоритмов для решения широкого круга задач и достижения результатов различными путями (возможно, параллельными). При этом к результату и приходят различными доступными путями, применяя различные методы к одним и тем же данным и интегрируя (на основе опыта и интуиции исследователя или заложенных в систему знаний) получаемую выходную информацию.
Работа по анализу изображения становится своего рода многократным экспериментированием с исходными данными. Характерной чертой такого эксперимента является совместное применение методов обработки изображений, математической статистики, искусственного интеллекта, анализа данных и других, причем в обработку по возможности вводятся все доступные данные, включая промежуточные результаты. Появляется необходимость организации эффективного обмена данными в системе, создания развитых средств хранения и обеспечения доступа к данным (включая базы видеоданных). В настоящее время это уже характерно для многих АСОИз, применяемых в дистанционных исследованиях.
Ключевым звеном АСОИз обычно считается процессор(ы), производящий обработку изображений. В первых системах в качестве обрабатывающего процессора часто применялись крупные универсальные ЭВМ, работающие в режиме разделения времени. Это решение оказалось малоэффективным, поскольку и системы команд, и операционные системы таких ЭВМ не ориентированы на задачи обработки изображений. В архитектуре АСОИз (рисунок 3) 70-х годов наряду с появлением специализированных процессоров обработки изображений получило широкое распространение монопольное использование средних и малых ЭВМ, ориентация которых на решение задач видеоданных достигалась разработкой соответствующего программного обеспечения. В настоящее время широкое распространение получили так называемые рабочие графические станции обработки изображений и системы, построенные на базе персональных ЭВМ.
Однако наличие одного процессора редко удовлетворяет требованиям по производительности системы, особенно при больших потоках обрабатываемых данных. Крупные АСОИз строятся, как правило, на основе специальных многопроцессорных конфигураций для параллельной обработки элементов одного или нескольких изображений, при этом упомянутые средние и малые ЭВМ обычно переходят в разряд управляющих.
Другими архитектурными компонентами АСОИз являются прежде всего устройства ввода видеоданных в систему (цифровые ТВ-камеры, дальномеры, малокадровые сканеры, фототелеграфные аппараты и т. д.), устройства отображения (ТВ-мониторы, растровые и векторные дисплеи, устройства вывода на твердые носители (плоттеры) — бумагу, кальку и фотопленку), запоминающие устройства (на магнитных носителях, оптических дисках; устройства расширения оперативной памяти для хранения изображений).
В настоящее время в интегрированных системах аппаратно реализуются не только параллельные процессоры обработки изображений, но и другие подсистемы, ранее традиционно реализуемые программным путем. Прежде всего здесь следует упомянуть средства доступа к различным видам памяти и средства, поддерживающие принятие решений. Особенно большую пользу приносят такие реализации при решении задач распознавания образов, интерпретации видеоданных, анализа сцен. Фактически аппаратные средства здесь поддерживают функционирование базы данных и базы знаний, но на качественно ином уровне. Основные решаемые задачи для базы видеоданных — это поиск эталонных объектов или их отдельных частей (видеопризнаков), поиск необходимых изображений по их идентификаторам. Чтобы решить эти задачи, разрабатываются специализированные процессоры баз видеоданных и массивы ассоциативной памяти с возможностью контекстного доступа к информации (адресация по содержимому).
К сети
Рисунок 3. Архитектура типичной АСОИз, основанной на персональной ЭВМ
Наиболее распространенными операционными системами (ОС) для АСОИз 80-х годов являются VMS (VAX) и UNIX RSX-11. Под управлением этих ОС в АСОИз используются различные языки высокого уровня, среди них Фортран, Паскаль, Си. С широким распространением персональных ЭВМ и «интеллектуализацией» АСОИз все большее значение приобретают ЛИСП и Пролог как средства поддержки и разработки баз знаний и интеллектуального интерфейса. Для этих ЭВМ характерно применение таких операционных систем, как WINDOWS (высоких версий), UNIX, OS/2.
Использование языков и техники параллельного программирования АСОИз, по-видимому, будет расширяться, однако это расширение коснется скорее синхронных многопроцессорных систем, где распараллеливание вычислительного процесса исходит от программиста, а не потоковых систем.
Стандартные наборы операций универсальных языков программирования высокого уровня не могут обеспечить специфические потребности пользователей АСОИз, поэтому одно из основных направлений в создании программного обеспечения обработки видеоданных — это разработка специализированных программных систем. Разработчики здесь идут двумя путями. Во-первых, расширяя существующие универсальные языки, создают специализированные языки программирования. Во-вторых, для рабочих станций обработки изображений формируют библиотеки программ или целостные программные системы, предназначенные для решения определенных задач конечных пользователей и написанные на одном из стандартных языков. Этим обеспечивается переносимость программных продуктов, что во многих случаях становится решающим фактором для пользователей.
Важное направление развития программного обеспечения АСОИз — создание эффективных систем хранения и поиска видеоданных (баз и банков видеоданных). Потребность в базах видеоданных ощущается прежде всего в области дистанционных исследований, поэтому именно здесь можно проследить тенденции развития программного обеспечения этих систем. От языков со встроенными функциями доступа довольно быстро произошел переход к интерактивным средствам манипулирования базой, а программы обработки запросов влились в системы поддержки и управления базой. Почти все существующие базы видеоданных — смешанные в смысле хранения как видео-, так и текстовой информации; характерной их особенностью является привязка содержания текста к элементам (объектам) изображения.
Все чаще в состав программного обеспечения АСОИз включаются и средства ведения баз знаний. Пока это преимущественно специализированные подсистемы для использования базы знаний о конкретной предметной области (например, о поиске месторождений определенного типа на аэрофотоснимке), но в скором времени можно ожидать появления инструментальных средств для разработки и наполнения знаниями экспертных систем анализа визуальной информации. С превращением АСОИз в системы для решения реальных задач повышается внимание к проблеме эффективного взаимодействия системы с конечным пользователем. Результат этого — быстрое развитие интерактивных средств общения с системой, создание «дружественных» пользователю прикладных программ, разработка языков взаимодействия командного типа и языков, основанных на выборе одной из предлагаемых системой альтернатив (меню, таблицы решений, spred sheet — крупномасштабная электронная таблица), а также развитие средств обучения, описания состояния и возможностей системы.