Как отмечалось, БД в простейшем случае представляется в виде системы двумерных таблиц. Таблицы могут быть представлены в ПК либо в виде отдельных файлов, либо размещаться в одном файле.
Файл— информация, хранимая на электронном носителе после завершения отдельных заданий и рассматриваемая в процессе обработки как единое целое. Файл имеет имя и требует некоторого объема памяти носителя, в качестве которого может выступать дискета, винчестер, компакт-диск (CD).
Поле — столбец файлового документа (таблицы). Имя поля часто называют атрибутом.
Домен— совокупность значений одного поля.
Универсум— совокупность значений всех полей.
Запись — строка документа. Следует отметить, что это понятие неоднозначно. В реляционной модели данных запись — строка таблицы, в сетевой модели данных — элемент структуры, аналогичный примерно таблице в реляционной модели данных.
Запись логическая — поименованная совокупность данных, рассматриваемая пользователем как одно целое.
Запись физическая (совокупность данных записываемых/считываемых одним блоком) характеризует расположение данных в физической памяти ПК.
Ключ — поле с уникальными (неповторяющимися) записями, используемое для определения места расположения записи. Ключ может состоять из совокупности полей (составной ключ), называемых суперключом.
Выделенный ключ — ключ, явно перечисленный вместе с реляционной схемой. В противном случае говорят о неявном ключе. Вводят и такие понятия как возможный ключ (ключ-кандидат), если любой из нескольких наборов полей может быть принят за составной ключ. Один из выделенных ключей называют первичным. При работе с несколькими связанными таблицами говорят о родительском ключе главной таблицы и внешнем ключе подчиненной таблицы. Иногда ключ называют идентификатором — атрибутом, значения которого однозначно определяют экземпляры объекта предметной области.
Предметная область — отражение в БД совокупности и объектов реального мира с их связями, относящимися к некоторой области знаний и имеющих практическую ценность для пользователя. Понятие «идентификатор» используется и в физической базе данных.
Указатель — идентификатор, который ведет к заданной записи из какой-то другой записи в физической базе данных. Здесь запись — некоторый блок данных в памяти компьютера.
Приведем перечень используемых в дальнейшем терминов, детальное пояснение которых проводится в последующих разделах данной работы.
Администратор базы данных (АБД) — лицо, отвечающее за выработку требований к БД, ее проектирование, реализацию, эффективное использование и сопровождение.
Архитектура — разновидность (обобщение) структуры, в которой какой-либо элемент может быть заменен на другой элемент, характеристики входов и выходов которого идентичны первому элементу. Понятие «принцип открытой архитектуры» используется при построении компьютера. Этот принцип означает, что вместо принтера одной марки (например, Epson) к компьютеру может быть подключен принтер другого типа (например, Hewlett Packard).
Безопасность — защита от преднамеренного или непреднамеренного нарушения секретности, искажения или разрушения.
Блокировка — неделимая операция, которая позволяет только одному процессу иметь доступ к совместно используемому ресурсу.
Вид (View) — таблица, вычисленная с помощью навигационной операции на основе исходной таблицы (таблиц). Вид может использоваться почти по тем же правилам, что и исходная таблица.
Внешняя схема — описание данных на концептуальном уровне. Как отмечалось, в реляционной БД порядок расположения полей (столбцов) таблицы безразличен. Однако для реализации следует выбрать вполне определенный порядок (схему). Чаще всего ключевые поля располагают в начале схемы.
Внутренняя схема — описание данных на физическом уровне.
Время доступа — промежуток времени между выдачей команды записи (считывания) и фактическим получением данных.
Время отклика — промежуток времени от момента запроса к БД до фактического получения данных.
Даталогическая модель — модель логического уровня, представляющая собой отображение логических связей безотносительно к их содержанию и среде хранения.
Доступ — операция поиска, чтения данных или записи их.
Задание (работа) — программа или совокупность программ и преобразуемые этими программами данные.
Защита данных — противостояние базы данных несанкционированному доступу, преднамеренному искажению или разрушению информации.
Индекс— совокупность указателей, содержащих информацию о местоположении записи. Для ускорения поиска полям сопоставляют уникальный набор (числовой или символьный). Индекс может быть представлен и несколькими полями. Если при построении БД заданы индексы, то для поиска сначала их и используют. Если индексов нет, то может проводиться длительный поиск путем перебора данных.
Концептуальный — определение, относящееся к обобщенному представлению данных, независимому от СУБД. При проектировании БД выделяют концептуальную, логическую и физическую базы данных (модели), определение которых приведено позднее.
Кортеж — совокупность полей или запись (строка).
КОДАСИЛ (CODASIL) — набор стандартов для сетевых баз данных.
Логический — определение, относящееся к представлению или описанию данных, не зависящему от запоминающей среды или вычислительной системы, однако «привязанное» к выбранной СУБД.
Машина баз данных (МБД) — вспомогательный периферийный процессор, выполняющий функции СУБД.
Метаданные— данные о данных, описание информационных ресурсов, их характеристик, местонахождения, способов использования и т. д. Например, перечень таблиц с характеристиками каждой из них (имя, объем памяти и другие параметры).
Многозначная зависимость (MV-зависимость, зависимость 1:М) — для подсхем X, Y, Z, принадлежащих схеме R, Z = R — (XY) и кортежей t2(X) = t1(X) и t3(Y) = t1(Y) справедливо t3(Z) = t1(Z) и t3(Z) = t2(Z).
Модель данных — средство абстракции, позволяющее видеть информационное содержание (обобщенную структуру), а не их конкретные значения. Выделяют, как отмечалось, иерархическую, сетевую, реляционную, объектно-ориентированную, объектно-реляционную и многомерную модели данных.
Навигация — операция, результат которой представлен единым объектом, полученным при прохождении пути по логической структуре БД. Иными словами, операция получения новой таблицы из полей связанных таблиц.
Независимость данных — возможность изменения логической и физической структуры БД без изменения представлений пользователя.
Объект— термин, обозначающий факт, лицо, событие, предмет, о котором могут быть собраны данные. В реляционных СУБД выделяют такие основные объекты, как таблицы, формы, запросы, отчеты, макросы, модули.
Объектно-ориентированное программирование — методология программирования, основанная на представлении программ в виде связанной совокупности объектов, каждый из которых является экземпляром определенного класса, а классы образуют иерархию по наследованию.
Объектно-ориентированное проектирование — методология проектирования, соединяющая в себе процесс объектной декомпозиции и приемы представления логических и физических, а также статических и динамических моделей проектируемой системы.
Подсхема— описание логического представления пользователя данной группы. Иными словами, это схема отдельного пользователя БД, если их несколько. Из подсхем может быть составлена схема БД (для всех пользователей). Нетрудно видеть, что при наличии одного пользователя подсхема является схемой.
Программа — полное и точное описание алгоритма на некотором формальном языке программирования.
Процедура— некоторая подпрограмма.
Распределенная база данных (РБД) — единая БД, представленная в виде отдельных (возможно, избыточных и перекрывающихся) разделов на разных вычислительных средствах.
Связь— ассоциация между экземплярами примитивных или агрегированных объектов (записей) данных.
Семантика— часть языка, касающаяся указания смысла и действия текста, составленного в соответствии с синтаксическими правилами. Действия текста относится к операторам на некотором языке программирования.
Синтаксис — правила, определяющие разрешенные языковые конструкции, а также последовательности расположения символов в программе.
Система баз данных — совокупность СУБД, прикладного программного обеспечения, базы данных, операционной системы и технических средств, обеспечивающих информационное обслуживание пользователей.
Система управления базой данных (СУБД) — совокупность программных средств, обеспечивающих управление БД на всех уровнях.
Системный журнал — журнал регистрации всех изменений БД.
Словарь данных — набор обобщенных описаний данных БД, обеспечивает логически централизованное хранение метаданных.
Спецификация— операция, результатом которой является новая структура, построенная на основе структур базы данных.
Структура — совокупность элементов и их связей.
Сущность — примитивный объект данных, отображающий элемент предметной области (человек, место, вещь и т. д.).
Схема данных — описание логической структуры данных, специфицированное на языке описания данных и обрабатываемое СУБД. Дело в том, что в общем случае поля таблицы (отношения) могут располагаться в произвольном порядке (семейство отношений). Для конкретного пользователя и в конкретной БД должен быть выбран и зафиксирован только один вариант порядка. Этот вариант называют схемой (пользователя).
Транзакция — процесс изменения файла или БД, вызванный передачей одного входного сообщения. Это сообщение (команду) часто тоже называют транзакцией.
Функциональная зависимость (F-зависимость, зависимость 1:1): схема Y функционально зависит от X, если для кортежей t,(X) = t,(X), справедливо t,(Y) = t2(Y), причем схемы X и Y могут принадлежать схеме R.
Хранимая запись — совокупность связанных элементов данных, соответствующая одной или нескольким логическим записям и содержащая все необходимые служебные данные.
Хранилище данных — предметно-ориентированный, интегрированный, привязанный ко времени и неизменный набор данных, предназначенный для поддержки принятия решений.
Целостность данных — устойчивость хранимых данных к разрушению (уничтожению), связанному с неисправностями технических средств, системными ошибками и ошибочными действиями пользователей.
Элемент данных — наименьшая единица данных, имеющая смысл при описании информации; наименьшая единица поименованных данных.
Экземпляр — отдельный экземпляр объекта, записи, элемента данных.
Язык базы данных — общий термин, относящийся к классу языков, которые используются для определения и обращения к базам данных.
Язык манипулирования данными (ЯМД) — командный язык, обеспечивающий доступ к содержимому БД и его обработку. Обработка предполагает вставку, удаление и изменение данных (операции обновления).
Язык описания данных (ЯОД) — предназначен для описания данных на концептуальном, логическом и физическом уровнях на основе соответствующих схем. Речь идет о командах по формированию структуры (шапки) таблиц и связей между ними. Эти операции могут быть обеспечены визуальным языком программирования QBE или директивным языком программирования SQL.
Язык запросов — высокоуровневый язык манипулирования данными, обеспечивающий взаимодействие пользователей с БД. Язык запросов предполагает выборку данных.
Следует отметить, что три группы операций с БД (описание, манипулирование, запрос) совмещены в языке SQL, а в некоторых СУБД — и в языке QBE.
Исходным элементом базы данных является таблица, структурные составляющие которой — поле и запись. Можно выделить две разновидности структуры таблиц: линейную и нелинейную. В линейной структуре поля располагаются последовательно друг за другом в произвольном порядке (табл. 1.11). В силу произвольности порядка для данной, конкретной реализации следует закрепить определенный вариант, называемый схемой пользователя.