Автором реляционной модели данных (РМД) является Э. Кодд. Математик по образованию, он предложил использовать аппарат теории множеств для определения структуры данных и операций работы с ними. Кодд доказал, что любое представление данных может быть сведено к совокупности двумерных таблиц особого вида – отношений (relation).
Формально, отношение определяется как подмножество декартового произведения образующих его множеств (доменов):
R D1 x D2 x … x Dn, где Di - i-ый домен отношения.
Таким образом, отношение представляет собой множество кортежей (n-ок) вида (a1, a2, …, an), где каждый ai Î Di. Дадим еще несколько определений.
Определение 1. Атрибут отношения есть пара вида <Имя_атрибута : Имя_домена>.
Имена атрибутов должны быть уникальны в пределах отношения.
Определение 2. Отношение R, определенное на множестве доменов D1, D2 …Dn (не обязательно различных), содержит две части: заголовок и тело.
Заголовок отношения (или схема отношения) содержит фиксированное количество атрибутов отношения:
Тело отношения содержит множество кортежей отношения. Каждый кортеж отношения представляет собой множество пар вида <Имя_атрибута : Значение_атрибута>:
(<A1:Val1>, A2:Val2>,…,<An:Valn>)
Отношение обычно записывается в виде:
,
или короче
,
Полем называется значение атрибута в кортеже отношения.
Важно иметь в виду, что каждый атрибут может быть определен только на одном домене, однако разные атрибуты могут быть определены на одном и том же домене. Напр., домен дата может определять несколько атрибутов: дата рождения, дата окончания школы и т.д.
Число атрибутов в отношении называют степенью(или -арностью) отношения. Мощность множества кортежей отношения называют мощностьюотношения.
Набор отношений образует реляционную модель БД (или просто реляционную БД – РБД). Не все РБД обладают одинаковыми свойствами. В случае неправильного её проектирования РБД может обладать аномалиями, которые значительно ухудшают характеристики её работы, такие как избыточность данных и время обработки данных. Различают следующие виды аномалий:
· Аномалии обновления.
· Аномалии добавления.
· Аномалии удаления.
Наличие аномалий связано со схемой отношения. Для определения качественной схемы отношения были введены понятия нормальной формы (НФ) отношения. Различают несколько видов НФ, которые отличаются ограничениями, накладываемыми на атрибуты отношения. Эти ограничения связаны с понятием функциональной зависимости атрибутов. Дадим определение функциональной зависимости.
Пусть X и Y – атрибуты некоторого отношения R. Если в любой момент времени каждому значению X соответствует единственное значение Y, то Y функционально зависитот X (X→Y).
Атрибут Y функционально полно зависимости от составного атрибута X, если он функционально зависит от X и не зависит функционально от любого подмножества атрибута X.
Теперь введем определения НФ.
Определение 3. Таблица находится в первой нормальной форме (1НФ) тогда и только тогда, когда каждое поле отношение содержит атомарное значение.
Определение 4. Отношение находится во 2НФ, если оно находится в 1НФ и каждый неключевой атрибут функционально полно зависит от ключа.
Определение 5. Отношение находится в 3НФ, если оно находится во 2НФ и каждый неключевой атрибут нетранзитивно зависит от первичного ключа.
Определение 6. Отношение находится в нормальной форме Бойса-Кодда (НФБК), тогда и только тогда, когда любая функциональная зависимость между его атрибутами сводится к полной функциональной зависимости от вероятностного ключа.
Для получения качественной РБД в большинстве случаев достаточно приведение схемы её отношений в 3НФ или НФБК. Для достижения этого используют процесс нормализации, т.е. приведения отношения в требуемую НФ. Процесс нормализации схемы отношения, входящего в состав РБД, выполняется путём её декомпозиции, разбиения отношения на отношения с более простой схемой. Декомпозицией схемы отношения R называется замена её совокупностью схем отношений Аi таких, что
,
При этом не требуется, чтобы отношения Аi были непересекающимися. Декомпозиция должна удовлетворять двум основным свойствам: