Гибридные нейронные нечёткие сети для извлечения нечётких правил из данных

Извлечение нечётких продукционных правил из числовых данных осуществляется, как правило, в рамках конкретной задачи, например аппроксимации функций или классификации образов. Существует несколько методов извлечения правил из числовых данных. Одним из известных методов для решения задачи аппроксимации является метод, предложенный Абе С. и Лэном М.-С. Суть метода заключается в следующем [4].

Пусть неизвестная функция характеризуется одномерным выходом y и n-мерным входным вектором x. Область, на которой определена переменная y, разделена на m интервалов:

, (8.119)

где - границы области. Назовём i-ый интервал выходным интервалом i.

Используя заданные входные данные, для которых выходы находятся в выходном интервале i, рекурсивно определяется область входных значений, соответствующая выходному интервалу i. Прежде всего, находятся области активизации, которые определяют входную область, соответствующую выходному интервалу i, посредством вычисления минимального и максимального значений входных данных для каждого выходного интервала.

Если область активизации для выходного интервала i перекрывается с областью активизации для выходного интервала j, то область перекрытия определяется как область запрещения.

Если входные данные для выходных интервалов i и/или j находятся внутри области запрещения, то определяется одна или две дополнительные области активизации. Если дополнительные области активизации также перекрываются, то определяется дополнительная область запрещения. Данный процесс повторяется до тех пор, пока проблема наложения областей не будет решена. Рисунок 8.14 иллюстрирует этот процесс.

Итерация 1

Область для выходного интервала i

Область для выходного интервала j

Итерация 2

Итерация 3

Рис.8.14. Рекурсивное определение областей активации и запрещения

Нечёткие правила определеяются на основе областей активизации либо на основе областей активизации и соответствующих областей запрещения (если они есть).

На рисунке 8.15 показана обобщённая структура гибридной нейронной нечёткой сети, вычисляющая степени принадлежности входных данных к соответствующим выходным интервалам с последующим приведением к чёткому значению. Так, для входного вектора x степень принадлежности к выходным интервалам от 1-го до m-ого определяется данной сетью и затем вычисляется чёткое значение y.

Перекрытие с интервалом j

x₁

…

max

min

Дефуззификатор

…

Для интервала i

x_k

x_n

max

Рис.8.15 Структура гибридной нейронной нечёткой сети Абе и Лэна для извлечения нечётких правил из данных при решении задачи аппроксимации функции

Данная сеть состоит из 4 слоёв. При этом различные выходные интервалы реализуются разными элементами слоёв 2-4. Между элементами этих слоёв, реализующими различные выходные интервалы переменной y, отсутствует какя-либо связь.

Слой 2. Элементы этого слоя реализуют нечёткие «ЕСЛИ-ТО» правила, вычисляющие степени принадлежности переменных входного вектора x.

Слой 3. Элементы этого слоя вычисляют максимальные значения выходов элементов слоя 2, которые представляют собой степени принадлежности, полученные в результате ликвидации перекрытий между парой выходных интервалов. Число элементов слоя 3 для выходного интервала i определяется по числу выходных интервалов, чьи входные пространства перекрываются со входным протранством данного выходного интервала i. Поэтому, если нет перекрытия между входными пространствами выходного интервала i и какого-либо другого выходного интервала, сеть для выходного интервала i уменьшается до двух слоёв.

Слой 4. Элемент этого слоя для выходного интервала i определяет минимальное значение среди максимальных значений, определённых в предыдущем слое и соответствующих перекрытию между двумя выходными интервалами. Поэтому если выходной интервал i перекрывается только с одним выходным интервалом, то сеть для выходного интервала i уменьшается до трёх слоёв. Вычисление минимума в слое 4 позволяет ликвидировать перекрытие среди более, чем двух выходных интервалов. Таким образом, в процессе образования входных областей необходимо избавиться от перекрытия между двумя интервалами одновременно.

Другой не менее эффективный по сравнению с вышерассмотренным методом извлечения нечётких правил из данных предложен Кругловым и Борисовым в [4] для решения задачи аппроксимации.

Предположим, что исследуемый объект имеет n входов (иначе, векторный вход x) и один выход y и имеет «истинное» (неизвестное) описание:

, (8.120)

где f(x) – функция неизвестного вида; e – случайная аддитивная помеха (отражающая действие неучитываемых системой факторов) с нулевым средним значением и произвольным (неизвестным) распределение на интервале .

Предположим, что на объекте может быть реализован эксперимент, заключающийся в регистрации K пар значений , , при этом величины (n-мерные векторы) измеряются без ошибок; значение K при необходимости допускает модификацию.

Алгоритм построения системы может быть описан следующим образом:

Этап 1. Из произвольных значений составляется начальная база знаний модели, отображаемая матрицей со строками вида

Такое представление, очевидно, соответствует набору нечётких продукционных правил вида:

П_k:ЕСЛИ x₁ есть A_k₁ И x₂ есть A_k₂И x_n есть A_kn, ТО y=B_k, k=1,…,m.

Этап 2. Для каждой новой экспериментальной точки рассчитывается прогнозируемое значение по формуле, соответствующей методу дефуззификации среднего центра:

, (8.121)

где - функция колокообразной или экспоненциальной формы:

, (8.122)

где - параметр функции.

Этап 3. Проверяется неравенство:

(8.123)

где d – заданная константа, определяющая погрешность аппроксимации.

При выполнении неравенства база нечётких правил пополняется путём расширения матрицы (добавлением строки ). В противном случае матрица остаётся без изменений.

Этап 4. Проверяется правило останова. В данном случае процесс извлечения правил считается завершённым, если в соответствии с этапами 2 и 3 перебраны все K экспериментальных данных (без учёта значений начальной базы).

Если не все экспериментальные точки использованы, то осуществляется переход к этапу 2.

В процессе реализации алгоритма матрица , а также параметры и d считаются априорно заданными.

Очевидно, что база нечётких правил не остаётся фиксированной, а модернизируется по мере поступления экспериментальных данных. Причём непротиворечивость нового продукционного правила относительно набора правил из базы гарантируется предложенной процедурой её пополнения.