Для формального описания данных выявлено несколько уровней абстракции, каждый из которых отражает определенную точку зрения на данные. В литературе отмечают различное число уровней [1, 2]. Примем к рассмотрению трехуровневую модель представления данных:
Уровень
Тип
Модель
I
внешний
логический
множество моделей индивидуальных представлений пользователей
II
концептуальный
логический
концептуальная
III
внутренний
физический
физическая
Рис. 4. Соответствие абстрактных уровней и моделей представления данных
Три уровня представления данных о реальном объекте отражают процесс формализации данных от пользовательского представления до физического воплощения.
I-й уровень – внешний (логический), связан с частным представлением данных группы пользователей в виде внешней схемы, объединяемых общностью используемой информации. Каждый конкретный пользователь работает с частью БД и представляет ее в виде внешней модели. Внешний уровень состоит из нескольких различных независимых представлений, которые могут по-разному отображать одни и те же данные.
II-й уровень - концептуальный (логический), является обобщенным представлением данных всех пользователей в абстрактной форме. Концептуальная модель отображает предметную область в виде взаимосвязанных объектов без указания способов их физического хранения. Для представления данных на этом уровне служат разнообразные модели: модель “сущность - связь” (ER-модель, модель Чена), бинарные и инфологические модели, семантические сети. Концептуальные модели подробно изложены в кн. Цикритзис Д., Лоховски Ф. Модели данных. М:.Финансы и статистика, 1985г.
Концептуальная модель представляет собой интегрированные концептуальные требования всех пользователей к базе данных данной предметной области. При этом усилия разработчика должны быть направлены, главным образом, на структуризацию данных. Естественным развитием концептуальных моделей являются структурные модели БД описанные ранее: иерархические, сетевые и реляционные.
III-й уровень - внутренний (физический), связан со способом фактического хранения данных в физической памяти ЭВМ. Во многом определяется конкретным типом СУБД и непосредственно зависит от методов доступа, реализованных в конкретной операционной системе. Основные проблемы физической организации: зависимость данных, жесткость, статичность, отсутствие интеграции, дублирование данных, противоречивость, невозможность совместного использования, неэффективность, невозможность обработки нетипичных запросов.
Между уровнями по вертикали соблюдается принцип независимости данных, т.е. информационные данные любого пользователя в БД никак не оказывают влияние на существующие внешние модели и не связаны с типом физической памяти, где хранятся данные.