Сетевую структуру данных можно представить в виде схемы.
Наиболее распространенными в практике являются реляционные (табличная организация данных) БД. Название «реляционная» (в переводе с английского - отношение) связано с тем, что каждая запись в таблице содержит информацию,относящуюся только к одному конкретному объекту.
Реляционные БД удобны еще и тем, что для получения ответов на различные запросы существует разработанный математический аппарат, который называется исчислением отношений или реляционной алгеброй. Ответы на запросы получаются путем «разрезания» и «склеивания» таблиц по строкам и столбцам. Ответы также будут иметь форму таблиц.
БД - это хранилище информации. Однако, работа с БД трудоемкая и утомительная. Для создания, ведения и осуществления возможности коллективного пользования БД используются программные средства, называемые СУБД.
В реляционной модели объекты и взаимосвязи между ними представляются с помощью таблиц. Термин "реляционная" происходит от англ. отношение.
Основными понятиями реляционных баз данных являются: тип данных, домен, атрибут, кортеж, первичный ключ и отношение.
Для начала покажем смысл этих понятий на примере таблицы (отношения) СОТРУДНИКИ, содержащего информацию о сотрудниках некоторой организации:
Понятие тип данных в реляционной модели данных полностью адекватно понятию типа данных в языках программирования. В современных реляционных БД допускается хранение символьных, числовых данных, специализированных числовых данных (таких как "деньги"), а также специальных данных (дата, время, временной интервал). В нашем примере мы имеем дело с данными трех типов: строки символов, целые числа и "деньги".
Домен - допустимые потенциальные множества значений данного типа. Например, домен "Имена" в нашем примере определен на базовом типе строк символов, но в число его значений могут входить только те строки, которые могут изображать имя (в частности, такие строки не могут начинаться с мягкого знака).
Семантическое понятие домена: данные считаются сравнимыми только в том случае, когда они относятся к одному домену. В нашем примере значения доменов "Номера пропусков" и "Номера групп" относятся к типу целых чисел, но не являются сравнимыми.
Схема отношения - это именованное множество пар {имя атрибута, имя домена (или типа, если понятие домена не поддерживается)}. Степень или "арность" схемы отношения - мощность этого множества. Степень отношения СОТРУДНИКИ равна четырем, то есть оно является 4-арным. Схема БД - это набор именованных схем отношений.
Кортеж, соответствующий данной схеме отношения, - это множество пар {имя атрибута, значение}, которое содержит одно вхождение каждого имени атрибута, принадлежащего схеме отношения. "Значение" является допустимым значением домена данного атрибута. Кортеж - это набор именованных значений заданного типа.
Отношение - это множество кортежей, соответствующих одной схеме отношения.
Обычным представлением отношения является таблица, заголовком которой является схема отношения, а строками - кортежи отношения-экземпляра; в этом случае имена атрибутов именуют столбцы этой таблицы. Поэтому иногда говорят "столбец таблицы", имея в виду "атрибут отношения". Реляционная база данных - это набор отношений, имена которых совпадают с именами схем отношений в схеме БД.
Основные понятия реляционных БД: нормализация, связи и ключи Нормализация –это пошаговый процесс замены одной таблицы другой. Имеющей более простую структуру. На каждом этапе нормализации таблицы приводятся к некоторому определенному виду. Который называется нормальной формой.
1. Принципы нормализации:
· В каждой таблице БД не должно быть повторяющихся полей;
· В каждой таблице должен быть уникальный идентификатор (первичный ключ);
· Каждому значению первичного ключа должна соответствовать достаточная информация о типе сущности или об объекте таблицы (например, информация об успеваемости, о группе или студентах);
· Изменение значений в полях таблицы не должно влиять на информацию в других полях (кроме изменений в полях ключа).
При проектировании БД необходимо создать такую структуру, которая бы обеспечивала минимальное дублирование информации и упрощала процедуры обработки и обновления данных. Требования к состоянию таблиц данных получили название нормальных форм. Первоначально были сформулированы три нормальные формы.