Первоначально в теории баз данных основное внимание уделялось средствам эффективной организации данных и манипулирования ими. В результате возникли три основные модели данных: иерархическая, сетевая и реляционная. Считалось, что предложенные средства достаточно универсальны для представления информации о любых предметных областях. Однако эти модели не содержат развитых средств для представления смысла данных. Семантика реальной предметной области должна независимым от модели способом представляться в сознании проектировщика. Поэтому в последние годы получило развитие направление, являющееся предметом активных исследований в конце 70-х – начале 80-х годов прошлого века – семантическое, или концептуальное, моделирование в базах данных. Его основная цель – организация интерфейса проектировщика, а также конечного пользователя с информационной системой на уровне представлений о предметной области, а не на уровне структур данных. В результате строилась модель предметной области, не зависящая ни от конкретной СУБД, ни от технических средств. Интерес к этому направлению возрос также в связи с развитием средств автоматизированного проектирования баз данных на основе CASE-технологий.
В настоящее время определился основной подход к решению задач семантического моделирования в базах данных. Он заключается в выделении двух уровней моделирования.
1) Уровня концептуального моделирования предметной области.
2) Уровня моделирования собственно базы данных.
На верхнем уровне осуществляется переход от неформализованного описания предметной области и информационных потребностей конечного пользователя к их формальному выражению с помощью специальных языковых средств. На нижнем уровне происходит преобразование концептуальной модели предметной области в схему базы данных и нормализация схемы базы данных.
Верхний уровень задачи семантического моделирования характеризуется четырьмя основными этапами.
1) Прежде всего, выявляется некоторое множество семантических концепций (понятий), которые могут быть полезны при неформальном обсуждении реального мира. Например, можно согласиться с тем, что мир построен из сущностей. Развивая данную концепцию, можно допустить, что сущности могут быть классифицированы по типам. Преимущество такой классификации заключается в том, что все сущности определенного типа будут обладать некоторыми общими свойствами. Более того, можно пойти еще дальше и согласиться с тем, что каждая сущность обладает неким особым свойством, предназначенным для ее идентификации, т.е. с тем, что каждая сущность обладает собственной идентичностью. Наконец, можно предположить, что каждая сущность может быть связана с другими сущностями посредством некоторых связей.
2) Далее определяется набор соответствующих символических (формальных) объектов, которые могут использоваться для представления описанных выше семантических концепций.
3) Затем определяется набор формальных общих правил целостности, предназначенных для работы с такими формальными объектами.
4) Наконец также определяется набор формальных операторов, предназначенных для манипулирования этими формальными объектами.
К настоящему времени разработано много различных концепций для построения таких моделей. Одной из таких концепций является модель «сущность – связь», предложенная П. Ченом в 1976 году, часто ее кратко называют ER-моделью. На различных разновидностях ER-модели основано большинство подходов к проектированию баз данных (главным образом, реляционных). Моделирование предметной области базируется на использовании графических диаграмм, включающих небольшое число разнородных элементов.