Для выполнения главных функций ИС существует комплекс средств, называемый обеспечивающим составом, иди обеспечением банков данных.
Он включает:
1) Техническое обеспечение, то есть все аппаратные средства, необходимые ьдля функционирования систем.
2) Математическое обеспечение – совокупность методов, способов математических моделей и алгоритмов управления БД и решения прикладных задач.
3) Программное обеспечение – это программы, в среде которых функционирует БД и набор сервисных программных средств, необходимых для выполнения вспомогательных операций и решения пользовательских задач.
4) Информационное обеспечение – представляет собой совокупность системы классификации и кодирования информации, входных документов и вспомогательных информационных массивов, в которых размещаются таблицы кодирования и другие данные.
5) Лингвистическое обеспечение – множество языков, использующихся в СУБД, и набор словарей, образующих словарный состав ИС.
6) Организационное обеспечение – комплекс мероприятий и руководящих документов, определяющих организацию повседневной эксплуатации банков данных и эффективное обслуживание пользователя.
Организация баз данных
Процесс создания БД включает 2 этапа:
1) Выработку логической организации БД;
2) Создание БД на носителе.
Логическая организация БД – представление пользователя о той предметной области, информация о которой должна храниться в БД, то есть это логическая модель предметной области. Такая модель отражает 3 вида информации:
сведения об объектах предметной области;
их свойства и
отношения между объектами.
Объекты на схеме представляются типами записи, свойства объекта – элементарными или групповыми данными (в виде полей записи), отношения – связями между типами записи и полями. Такая модель не зависит от физической среды, то есть типа компьютера, операционной системы и СУБД, так как абстрагируется от смыслового содержания данных, отражает только формы представления информации и связи между данными.
Логическую модель можно представить несколькими способами. Для ИС характерны 2 способа схемы представления данных – графический и табличный.
Графический способ основан на изображении моделей данных в виде ориентированного графа, вершины которого служат для отображения типов записей, в дуги – связи между записями.
Табличный способ состоит в представлении информации о предметной области в виде одной или нескольких таблиц, заголовок каждой из которых аналогичен типу записи графической модели.
В настоящее время известны 3 графические модели:
§ иерархическая;
§ сетевая;
§ реляционная.
Последняя наиболее широко применяется на ПК.
Иерархическая модель данных основана на графическом способе. Она представляет собой дерево, в вершинах которого располагаются типы записей, каждая из вершин связана только с одной вершиной вышележащего уровня.
Рис. 16. Иерархическая модель данных.
Поиск данных в такой структуре выполняется по одной из ветвей, начиная с корневого элесента, то есть должен быть указан полный путь движения по ветви. Так, для поиска и выбора одного или нескольких экземпляров записи типа «Студент» необходимо указать корневой элемент «Факультет», элементы «Курс» и «Группа».
Сетевая модель данных также использует графический способ представления данных, и схема также отображается в виде графа. Однако, по сравнению с иерархической моделью, никаких ограничений на количество связей, входящих в каждую вершину, не накладывается, что позволяет отражать связь между объектами предметной области практически любой степени сложности, в частности кольцевой структуры.
Рис. 17. Сетевая структура данных.
Реляционная модель данных (РМД) строится на использовании табличных средств представления данных и манипулирования ими. в РМД вся информация о предметной области отображается в таблице, которая называется отношением.
Строка называется кортежем, столбец - атрибутом.
Каждый атрибут может принимать подмножество значений из определённой области, которая называется доменом. Домен, таким образом, является областью определения одного или нескольких атрибутов. Отношения к кортежам и атрибутам присваиваются имённо.
Отношения характеризуются числом кортежей (m) и числом атрибутов (n), составляющие яркость отношений. Различают:
§ унарные (n=1);
§ бинарные (n=2);
§ тернарные (n=3);
§ и т.д. (n-арные отношения).
К отношению предъявляется ряд требований:
1) Значение атрибута, то есть данные, расположенные на пересечении строки и столбца, являются неделимыми, элементарными (атомарными).
2) В отношении не может быть двух одинаковых кортежей, то есть двух одинаковых строк.
3) Ряд следования атрибутов в отношении – фиксирован, то есть нельзя переставить столбцы местами.
4) Порядок следования кортежей не фиксирован.
Эти требования создали предпосылки для применения к отношению РМД математического аппарата реляционной алгебры.
Существует определённая аналогия между структурой отношений и организации данных, предусмотренной в операционной системе:
§ Атрибут отождествляется с полем записи;
§ Кортеж – с экземпляром записи;
§ Отношение – с файлом.
В состав РМД может входить несколько отношений, каждое из которых имеет свою схему, поэтому под РМД понимается набор отношений, удовлетворяющих указанными ниже требованиям.
Рис. 18. Реляционная модель данных.
Для поиска данных по ключу отдельные атрибуты объявляются в качестве возможных ключей, один из которых назначается первичным. Форма отношения, удовлетворяющая требованиям, предъявляемым к РМД, называется нормальной формой, а процесс приведения отношений к нормальной форме называется нормализацией отношений.
В настоящее время используются 6 нормальных форм и 6 этапов нормализации:
§ Приведение к 1 нормальной форме (1 NF);
§ 2 NF;
§ 3 NF;
§ 4 NF;
§ 5 NF;
§ к 6 (Бойсо-Кодда).
Отношение называются нормализованными, если оно находится в одной из этих форм.
На каждую из форм распространяется принцип вложенности. Если отношение находится в форме с номером N, например, в 3 NF, то оно обязательно находится и в форме N-1. Обязательным условием для работы с РМД является нахождение 1 NF.
Преобразование из таблицы в другие формы необходимо в том случае, если наблюдается добавление или удаление кортежей либо атрибутов, в результате чего в таблице могут возникать искажения информации. Отношение находится в 1 NF, если значения всех его атрибутов атомарны. Одним из способов приведения отношения к первой нормальной форме является декомпозиция, то есть разложение на 2 и более новых отношений, совокупность эквивалентных исходов.
Основной недостаток РМД – большая информационная избыточность, как на логическом, так и на физическом уровне. Трудоёмким является также процесс нормализации отношений.
Кроме рассмотренных моделей, иногда используется и простейшая организация данных – модель на плоских файлах. Плоскими называются файлы, в которых не предусматривается ни прямых, ни косвенных связей между типами данных. Так, если в структуре иерархической и сетевой моделей данных убрать все связи, а в таблице РМД не использовать поле «Должность» в качестве атрибута связи, то эти модели превратятся в модель БД на плоских файлах.