Отношение находится во второй нормальной форме, если оно находится в первой нормальной форме, и каждый неключевой атрибут функционально полно зависит от первичного ключа (атрибут называется неключевым, если он не является составной частью первичного ключа). Основное действие: удаление частичной зависимости.
Отношение Преподаватель уже находится во второй нормальной форме, поскольку первичный ключ состоит из одного атрибута.
Рассмотрим подробнее отношение Преподаватель–Экзамен–Группа. Можно заметить, что атрибуты, связанные группой, зависят только от части первичного ключа. Также Наименование экзамена зависит только от части первичного ключа.
Исходя из этого наблюдения рекомендуется разбить отношение на три, удалив атрибут Группа, так как он зависит от Код группы. И удалив атрибут Наименование экзамена, так как он зависит от Код экзамена. В результате получены четыре отношения, находящиеся во второй нормальной форме:
Отношение находится в третьей нормальной форме, если оно находится во второй нормальной форме и каждый неключевой атрибут нетранзитивно зависит от первичного ключа.
Основное действие: удаление транзитивной зависимости.
Отношение Группа уже находится в третьей нормальной форме, поскольку все атрибуты зависят непосредственно от первичного ключа. Отношения Экзамен и Дата экзамена также находятся в третьей нормальной форме. Рассмотрим подробнее отношение Преподаватель: можно заметить, что атрибут Кафедра зависит от Код преподавателя через Код кафедры. Основываясь на данном наблюдении разобьем отношение на следующие два:
В результате получены пять отношений: Преподаватель, Кафедра, Экзамен, Группа, Дата экзамена, каждое из которых находится в третей нормальной форме. Нормализация завершена.
В качестве обобщения материала предыдущего подраздела приведем наиболее важные рекомендации, неучет которых может привести к аномалиям при обработке данных в базах. Остановимся на двух вопросах: исходя из каких соображений нужно создавать отношения (таблицы) и каким образом следует их связывать.
Основное правило при создании таблиц сущностей - это «каждой сущности - отдельную таблицу» (как в популярном лозунге: «каждой семье - отдельную квартиру»),
Поля таблиц сущностей могут быть двух видов: ключевые и неключевые. Введение ключей в таблице практически во всех реляционных СУБД позволяет обеспечить уникальность значений в записях таблицы по ключу, ускорить обработку записей таблицы, а также выполнить автоматическую сортировку записей по значениям в ключевых полях.
Обычно достаточно определения простого ключа, реже - вводят составной ключ. Таблицей с составным ключом может быть, например, таблица хранения списка сотрудников (фамилия, имя и отчество), в котором встречаются однофамильцы. В некоторых СУБД пользователям предлагается определить автоматически создаваемое ключевое поле нумерации (в Access - это поле типа «счетчик»), которое упрощает решение проблемы уникальности записей таблицы.
Иногда в таблицах сущностей имеются поля описания свойств или характеристик объектов. Если в таблице есть значительное число повторений по этим полям и эта информация имеет существенный объем, то лучше их выделить в отдельную таблицу (придерживаясь правила: «каждой сущности - отдельную таблицу»). Тем более, следует образовать дополнительную таблицу, если свойства взаимосвязаны.
В более общем виде последние рекомендации можно сформулировать так: информациюо сущностях следует представить таким образом, чтобы неключевые поля в таблицах были взаимно независимыми и полностью зависели от ключа (см. определение третьей нормальной фирмы).
В процессе обработки таблиц сущностей надо иметь в виду следующее. Новую сущность легко добавить и изменить, но при удалении следует уничтожить все ссылки на нее из таблиц связей, иначе таблицы связей будут некорректными. Многие современные СУБД блокируют некорректные действия в подобных операциях.
Записи таблицы связей предназначены для отображения связей между сущностями, информация о которых находится в соответствующих таблицах сущностей.
Обычно одна таблица связей описывает взаимосвязь двух сущностей. Поскольку таблицы сущностей в простейшем случае имеют по одному ключевому полю, то таблица связей двух таблиц для обеспечения уникальности должна иметь два ключа. Можно создать таблицу связей, как и таблицу объектов, и без ключей, но тогда функции контроля за уникальностью записей ложатся на пользователей.
Более сложные связи (не бинарные) следует сводить к бинарным. Для описания взаимосвязей N объектов требуется N-1 таблиц связей. Транзитивных связей не должно быть. Избыток связей приводит к противоречиям.
Не следует включать в таблицы связей характеристики сущностей, иначе неизбежны аномалии. Их лучше хранить в отдельных таблицах сущностей.
С помощью таблиц связей можно описывать и несколько специфичный вид связи - линейную связь, или слабую связь. Примером линейной связи можно считать отношение принадлежности сущностей некоторой другой сущности более высокого порядка (системы, состоящие изузлов; лекарства, состоящие из компонентов; сплавы металлов и т. д.). В этом случае для описания связей достаточно одной таблицы связей.
При работе с таблицами связей следует иметь в виду, что любая запись из таблицы связей легко может быть удалена, поскольку сущности некоторое время могут обойтись и без связей. При добавлении или изменении содержимого записей таблицы надо контролировать правильность ссылок на существующие объекты, так как связь без объектов существовать не может. Большинство современных СУБД контролируют правильность ссылок па объекты.