Информационный фонд системы управления должен обеспечивать получение выходных наборов данных из входных с помощью алгоритмов обработки и корректировки данных. Это возможно, если создана инфологическая модель предметной области, которая вместе с наборами хранимых данных и алгоритмами их обработки позволяет построить каноническую модель (схему) информационной базы, а затем перейти к логической схеме и, далее, к физическому уровню реализации.
Инфологической (концептуальной) моделью предметной области называют описание предметной области без ориентации на используемые в дальнейшем программные и технические средства (рисунок 7).
Рисунок 7. Информационно-логическая (инфологическая) модель
Однако, для построения информационной базы инфологической модели не достаточно. Необходимо провести анализ информационных потоков в системе с целью установления связи между элементами данных, их группировки в наборы входных, промежуточных и выходных элементов данных, исключения избыточных связей и элементов данных. Получаемая в результате такого анализа безызбыточная структура носит название канонической структуры информационной базы и является одной из форм представления инфологической модели предметной области.
Для анализа информационных потоков в управляемой системе исходными являются данные о парных взаимосвязях, или отношениях (т.е. есть отношение или нет отношения) между наборами информационных элементов. Под информационными элементами понимают различные типы входных, промежуточных и выходных данных, которые составляют наборы входных N1, промежуточных N2 и выходных N3 элементов данных.
Формализовано связи (парные отношения) между наборами информационных элементов
отображаются в виде матрицы смежностиB,под которой понимают квадратную бинарную матрицу, проиндексированную по обеим осям множеством информационных элементов
,
где s - число этих элементов.
где qij=
;
В позиции (i,j) матрицы смежности записывают „1“(т.е.qij =1), если между информационными элементами и существует отношение R0, такое, что для получения значения информационного элемента необходимо непосредственное обращение к элементу . Наличие такого отношения между и обозначают в виде , чему соответствует qij =1, а отсутствие - и запись „0“ в позиции ( ), т.е. . Для простоты принимают, что каждый информационный элемент недостижим из самого себя:
; .
Матрице B ставится в соответствие информационный граф . Множеством вершин графа является множество D информационных элементов, а каждая дуга (di, dj) соответствует условию ; т.е. записи „1“ в позиции ( ) матрицы B.
Например, задано множество D из четырех наборов информационных элементов, т.е. . Пусть матрица смежности B этих элементов
имеет вид: .
Из этой матрицы видно, что для вычисления элемента необходимо обращение к элементам и , а для получения элемента - к элементу . Чтобы получить элемент , надо обратиться к . Элемент не зависит от других элементов матрицы. Информационный граф в этом простейшем случае будет соответствовать рисунок 8.
Рисунок 8. Информационный граф
В общем случае структура графа вследствие неупорядоченности сложна для восприятия и анализа. Составленная на основе инфологической модели, она не гарантирована от неточностей, ошибок, избыточности и транзитивности. Для формального выделения входных, промежуточных и выходных наборов информационных элементов, определения последовательности операций их обработки, анализа и уточнения взаимосвязей на основе графа строят матрицу достижимости.
Матрицей достижимости M называют квадратную бинарную матрицу, проиндексированную по обеим осям множеством информационных элементов D, аналогично матрице смежности B. Запись „1“ в каждой позиции (ij) матрицы достижимости соответствует наличию для упорядоченной пары информационных элементов ( ), смыслового отношения достижимости R. Элемент достижим из элемента , т.е. выполняется условие , если на графе существует направленный путь от вершины к вершине (в процессе получения значения элемента используется значение элемента ). Если , то отношение достижимости между элементами и отсутствует и в позиции (ij) матрицы M записывают „0“. Отношение достижимости транзитивно, т.е. если и , то ; .
Записи „1“ в j-м столбце матрицы M соответствуют информационным элементам , которые необходимы для получения значений элементов , и которые образуют множество элементов предшествования A( ) для этого элемента. Записи „1“ в i-ой строке матрицы M соответствуют всем элементам , достижимым из рассматриваемого элемента и образующим множество достижимости R( ) этого элемента. Информационные элементы, строки которых в матрице M не содержат единиц (нулевые строки), являются выходными информационными элементами, а информационные элементы, соответствующие нулевым столбцам матрицы M, являются входными. Это условие может служить проверкой правильности заполнения матриц B и M , если наборы входных и выходных информационных элементов известны. Информационные элементы, не имеющие нулевой строки или столбца, являются промежуточными.
Для полученного в примере графа (рис. 4.3) матрица M будет выглядеть так:
Отличие столбцов матриц M и B объясняется тем, что в матрице M учитывается смысловое отношение между информационными элементами, а в матрице B только непосредственное . Например, элемент в матрице M достижим из элементов, , и , т.е. , и , в то время как в матрице B для этих элементов достижим только из , т.е. только , а и . Из анализа матрицы M следует, что элемент является входным, - выходным, остальные - промежуточные. На основе матрицы M строится информационный граф системы, структурированный по входным ( ), промежуточным ( ) и выходным ( ) наборам информационных элементов, и полученный из анализа множеств элементов предшествования A( ) и достижимости R( ). Граф , полученный из матрицы M рассматриваемого примера, приведен на рисунке 4.4.
В общем случае информационный граф системы, в отличие от вычисленного графа, может иметь контуры и петли, что объясняется необходимостью повторного обращения к отдельным элементам данных.
Рисунок 9. Информационный граф
Информационный граф системы структурируется по уровням ( , , ) с использованием итерационной процедуры, что позволяет определить информационные входы и выходы системы, выделить основные этапы обработки данных, их последовательность и циклы обработки на каждом уровне. Кроме того, удаляются избыточные (лишние) дуги и элементы. Граф, получаемый после структуризации по наборам информационных элементов и удаления избыточных элементов и связей, определяет каноническую структуру информационной базы. Таким образом, каноническая структура задает логически неизбыточную информационную базу. Выделение наборов элементов данных по уровням позволяет объединить множество значений конечных элементов в логические записи и тем самым упорядочить их в памяти ЭВМ.
От канонической структуры переходят к логической структуре информационной базы, а затем - к физической организации информационных массивов. Каноническая структура является также основой для автоматизации основных процессов предпроектного анализа предметных областей систем управления.
Процедуры хранения, актуализации и извлечения данных непосредственно связаны с базами данных, поэтому логический уровень этих процедур определяется моделями баз данных.