Понятие пятой нормальной формы связано с понятием зависимости соединения. Рассмотрим следующий пример. Пусть имеется отношение ПТП, заданное следующей таблицей:
Поставщик
Товар
Потребитель
Ф 1
Товар 1
П 2
Ф 1
Товар 2
П 1
Ф 2
Товар 1
П 1
Ф 1
Товар 1
П 1
Проекции отношения на два атрибута имеют вид:
ПТ ТП ПП
Поставщик
Товар
Товар
Потребитель
Поставщик
Потребитель
Ф 1
Товар 1
Товар 1
П 2
Ф 1
П 2
Ф 1
Товар 2
Товар 2
П 1
Ф 1
П 1
Ф2
Товар 1
Товар 1
П 1
Ф 2
П 1
Для естественных соединений получим:
ПТ½><½ТП=ПТ½><½ПП=ТП½><½ПП, причем результат будет равен
Поставщик
Товар
Потребитель
Ф 1
Товар 1
П 2
Ф 1
Товар 2
П 1
Ф 2
Товар 1
Излишний кортеж
П 1
Ф 2
Товар 1
П 2
Ф 1
Товар 1
П 1
В тоже время ПТ½><½ТП)½><½ПП=ПТП.
Таким образом, естественное соединение любых двух проекций не дает исходного соединения. В тоже время естественное соединение трех проекций приводит к исходному отношению.
Подобное свойство может быть присуще не только отношению, но и схеме отношения и касаться произвольного числа проекций.
Пусть R схема отношений на множестве атрибутов U, а A, B, …, Z – произвольные подмножества множества U. Схема R удовлетворяет зависимости соединения
*{A, B, …, Z}
тогда и только тогда, когда любое отношение со схемой R эквивалентно естественному соединению его проекций на A, B, …, Z.
Для зависимости соединения теорема Фейгина имеет следующую формулировку:
Схема R с множеством атрибутов U=AÈBÈC удовлетворяет зависимости соединения *{AB, AC} тогда и только тогда, когда она удовлетворяет многозначной зависимости A¾>>B/C.
Формально получим следующее:
A¾>>B/C =*{AB, AC}.
Из определения зависимости соединения следует, что из всех возможных форм это наиболее общая форма зависимости. То есть не существует более высокой степени зависимости, по отношению к которой зависимость соединения является всего лишь частным случаем.
На основании зависимости соединения дается определение пятой нормальной формы.
Схема отношения R находится в пятой нормальной форме (5НФ) тогда и только тогда, когда каждая нетривиальная зависимость соединения подразумевается ее ключами.
Зависимость соединения *{A, B, …, Z} называется тривиальной, если одна из проекций на A, B, …, Z совпадает с R.
Заданная зависимость соединения *{A, B, …, Z} подразумевается ключами тогда и только тогда, когда каждое подмножество атрибутов A, B, …, Z фактически является суперключом для схемы R. Таким образом, относительно заданной схемы отношения R можно утверждать, что она находится в 5НФ, только при условии, что известны все ее ключи и все зависимости соединения, существующие в ней. Смысловое значение зависимостей соединения, которые не являются одновременно многозначными и функциональными, далеко не очевидно. Следовательно, процедура определения того, что некоторая схема все еще находится в 4НФ, а не в 5НФ, и, таким образом, существует возможность её дальнейшей декомпозиции, все еще остается не вполне ясной.
Как следует из определения, 5НФ является окончательной нормальной формой по отношению к операциям проекции и соединения. Таким образом, если схема находится в 5НФ, то гарантируется, что она не содержит аномалий, которые могут быть исключены посредством ее разбиения на проекции.