Основные признаки классификации банка данных (БнД).
Волгодонский инженерно-технический институт – филиал НИЯУ МИФИ
Булава В. А.
Специальные разделы информатики
Курс лекций
Волгодонск 2010
Определение базы данных (БД) и банка данных (БнД)
Банк данных (БнД) – это система специально организованных данных, программных, языковых, организационных и технических средств, предназначенных для централизованного накопления и коллективного многоцелевого использования данных. Под базой данных (БД) обычно понимается именованная совокупность данных, отображающая состояние объектов и их отношений в рассматриваемой предметной области. Характерной чертой баз данных является постоянство: данные постоянно накапливаются и используются; состав и структура данных, необходимых для решения тех или иных прикладных задач, обычно постоянны и стабильны во времени; отдельные или даже все элементы данных могут меняться – но это и есть проявление постоянства – постоянная актуальность. Услугами БнД пользуется обычно большое число пользователей. Поэтому в БнД предусматривается специальное средство приведения всех запросов к единой терминологии - словарь данных. Кроме того, используются специальные методы эквивалентных грамматических преобразований запросов для построения оптимальных процедур их обработки, специальные методы доступа к одним и тем же данным различных пользователей при совпадении во времени поступивших запросов - механизм транзакций. Обычно со стороны внешних пользователей к БнД формулируются следующие требования. БнД должен:
• Удовлетворять актуальным информационным потребностям внешних пользователей, обеспечивать возможность хранения и модификации больших объемов многоаспектной информации. • Обеспечивать заданный уровень достоверности хранимой информации. • Обеспечивать доступ к данным только пользователям с соответствующими полномочиями. • Обеспечивать возможность поиска информации по произвольной группе признаков. • Удовлетворять заданным требованиям по производительности при обработке запросов. • Иметь возможность реорганизации и расширения при изменении границ ПО. • Обеспечивать выдачу информации пользователю в различной форме. • Обеспечивать простоту и удобство обращения внешних пользователей за информацией. • Обеспечивать возможность одновременного обслуживания большого числа внешних пользователей. Преимущества централизации управления данными:
• Сокращение избыточности хранимых данных (минимально необходимых - дублирование данных).
• Устранение противоречивости хранимых данных (хранимых в различных файлах). • Многоаспектное использование данных (принцип однократного ввода данных для разных пользователей и приложений).
• Комплексная оптимизация. (Например, выбор структуры хранения данных, которая обеспечивает наилучшее обслуживание в целом). В максимальной степени удовлетворяются противоречивые требования.
• Обеспечение возможности стандартизации (упрощение обмена данных, контроля и восстановления данных). • Обеспечение возможности санкционированного доступа к данным. Интеграция данных приводит к тому, что данные, используемые различными пользователями, могут пересекаться различным образом. Следовательно, важно наличие в этих условиях механизма защиты данных от несанкционированного доступа к ним. БнД через СУБД обеспечивает независимость прикладных программ от данных, чтобы не выполнять трудоемких ручных операций по внесению соответствующих изменений в прикладные программы. Рассматривая данные как один из ресурсов АС (автоматизированных систем), можно сказать, что БнД централизованно управляет этим ресурсом в интересах всей системы. Наличие централизованного управления данными - главная отличительная черта БнД. БнД - информационная система, реализующая централизованное управление данных в интересах всех пользователей АС. (Средство интеграции данных). БнД - может рассматриваться в узком и широком смысле этого понятия. В узком БнД=БД + СУБД. В широком БнД =АС (автоматизированная система). БнД в узком смысле включает в состав две основные компоненты:
• БД;
• СУБД - для реализации централизованного управления данными, хранимыми в базе, доступа к ним, поддержание их в состоянии, соответствующем состоянию ПО. В широком смысле БнД - это АС.
Управляет БнД администратор банка данных (АБД). Словарь данных (СД) представляет собой специальную систему в составе БнД, предназначенную для хранения динообразной информации обо всех ресурсах данных конкретного банка. В словаре содержатся сведения об объектах, их свойствах и отношениях для данной ПО, сведения о данных, хранимых в базе (наименования данных, их структуре, связи с другими данными), об их возможных значениях и форматах представления, об источниках их возникновения, о кодах защиты, разграничениях доступа к данным со стороны пользователей. Основной функцией АБД является обеспечение структур данных и взаимосвязь между ними, эффективных для обслуживания именно всего коллектива пользователей. Это функция администрирования БД. БнД отличаются тем, что их внедрение и последующая эксплуатация занимает довольно продолжительное время. Поэтому функции АБД являются долгосрочными и направлены на координацию всех этапов проектирования, реализации и ведения БД. На стадии проектирования АБД выступает основным идеологом, руководит всеми работами по разработке или приобретению ПО, обучение обслуживающего персонала и т.п. На стадии эксплуатации отвечает за нормальную эксплуатацию и функционирование БнД, управляет режимом работы, отвечает за сохранность данных. Функции АБД:
• решать вопросы организации данных об объектах ПО и установлении связей между этими данными с целью объединения информации о различных объектах; согласовывать представления пользователей;
• координировать все действия по проектированию, реализации и ведению БД; учитывать текущие и перспективные требования пользователей; следить, чтобы БД удовлетворял актуальным информационным потребностям;
• вопросы расширения БД в связи с изменением границ ПО;
• защита данных от некомпетентного использования, от сбоев ТС, определения степени секретности части информации и разграничения доступа к ним;
• ведение СД, контроль избыточности и противоречивости, достоверность; • методы хранения данных, пути доступа к ним, связей между данными, определение форматов данных, определять степень влияния изменений в данные на всю БД; • координация вопросов технического обеспечения системы;
• координация работы системных программистов, разрабатывающих дополнительные ПО для улучшения эксплуатационных характеристик системы;
• координация работы прикладных программистов, разрабатывающих новые прикладные программы в рамках состава ПО системы.
Структура БнД:
• информационная база – данные, отражающие состояние определенной предметной области и используемые информационной системой. Состоит из двух компонент: 1) коллекции записей собственно данных; 2) описания этих данных – метаданных. Данные могут использоваться (т. е. представляться) по-разному. С одной стороны, разные прикладные задачи требуют разных наборов данных, в совокупности обеспечивающих функциональную полноту информации, а с другой – они должны быть различны для различных категорий субъектов (разработчиков или пользователей). Назначение – представление данных на трех уровнях. В литературе по БД упоминается три уровня представления данных: концептуальный -пользователь, разработчик ИС, внешний (логический) – прикладной программист, внутренний (физической) - СУБД; • лингвистические средства обеспечивают интерфейс пользователей разных категорий с банком данных и базируются на языковых средствах СУБД. Включают в себя ЯОД, описание, модель данных и их отношения и ЯМД – средства запросов к БД и поддержания БД; • программные средства осуществляют обработку данных и управление этой обработкой в вычислительной среде, а также взаимодействие с операционной системой и прикладными программами. Компоненты: ядро (обеспечивает управление данными во внешней и оперативной памяти, а также протоколирование изменений), процессор языка баз данных (обработка – трансляция или компиляция – и оптимизация запросов на выборку и изменение данных), подсистема (библиотека) поддержки программных вызовов (обслуживает прикладные программы управления данными, взаимодействующие с СУБД через средства пользовательского интерфейса), сервисные программы (системные и внешние утилиты) (обеспечивают настройку СУБД, восстановление после сбоев и ряд дополнительных возможностей обслуживания); • технические средства служат для обеспечения эффективной и бесперебойной работы баз данных. Должны быть отказоустойчивыми, иметь надежные устройства ввода-вывода и объемные быстродействующие накопители;
• организационно-административные подсистемы и нормативно-методическое
беспечение – не являются технической компонентой системы, однако трудно рассчитывать на устойчивое и долговременное функционирование банка данных, если будут отсутствовать необходимые методические и инструктивные материалы, регламентирующие работу пользователей, различных по своему статусу и уровню полноценности.
Классификация баз и банков данных может быть произведена по разным признакам. 1. По форме представляемой информации можно выделить фактографические, документальные, мультимедийные, в той или иной степени соответствующе цифровой, символьной и другим (нецифровой и несимвольной) формам представления информации и вычислительной среде.
2. По типу хранимой (не мультимедийной) информации можно выделить актографические, документальны, лексикографические БД. Лексикографические – классификаторы, модификаторы, словари основных слов, тезаурусы, рубрикаторы и т.д. Документальные – полнотекстовые («первичные» документы) и библиографическо-реферативные («вторичные» документы, отражающие на адресном и содержательном уровнях первичный документ).
3. По типу используемой модели данных – иерархические, сетевые, реляционные. 4. По типологии хранения – локальные и распределенные.
5. По типологии доступа и характеру использования хранимой информации – специализированные и интегрированные.
6. По функциональному назначению (характеру решаемых задач и, соответственно, характеру использования данных) – операционные и справочно-информационные. К последним относятся ретроспективные БД (электронные каталоги библиотек), которые используются для информационной поддержки основной деятельности и не предполагают внесения изменений в уже существующие записи, например, по результатам этой деятельности. Операционные БД предназначены для управления различными технологическими процессами.
7. По сфере возможного применения можно различать универсальные и специализированные (или проблемно-ориентированные) системы.
8. По степени доступности можно выделить общедоступные и БД с ограниченным доступом пользователей. Следует отметить, что представленная классификация не является полной и исчерпывающей.
Начало 60-х г. Простые (линейные) файлы данных- записи в файлах размещаются и обрабатываются последовательно. Физическая структура такая же как и логическая. - программное обеспечение ввода-вывода выполняет только операции физической записи и чтения. При обновлении отдельной записи файл переписывается на другой носитель - физическое распределение данных включается в прикладную программу. При смене структуры или носителя программа перезаписывается.
- наборы данных создаются и оптимизируются только для 1-го приложения
Методы доступа к записи (конец 60-х)- появились дисковые устройства с прямым доступом. Можно менять расположение набора данных без изменения структуры записи. - логическая структура отличается от физической, но связь простая. Записывающее устройство можно менять изменения прикладной программы - файл создается в прикладной программе как набор данных с последовательно индексацией, прямым доступом (по физ. адресу). Поиск по многим ключам не используется. Возможен последовательный или произвольный доступ к записям. - данные в основном разрабатываются и оптимизируются для одного приложения. - средства защиты данных недостаточно надежны.
Первая система СУБД (начало 70-х).Стремление сделать программу независимой не только от изменений в аппаратных средствах, но и от добавления полей и взаимодействия в таблице - различные логические файлы могут быть получены из одних физ. данных. Доступ к одним и тем же данным может осуществляться разными приложениями и по разным путям - данные адресуются на уровни полей и групп. Поиск по многим ключам - физическая структура данных не зависит от прикладных программ - элементы данных являются общими для различных приложений. Отсутствие избыточности способствует целостности данных.
СУБД Вводятся 2 уровня независимости данных :
- Логический - общая логическая структура может быть изменена без изменения прикладных программ - Физическая независимость. Расположение и организация данных не влияют ни на лог структуру ни на прикладную программу + вводятся инвертирование файлов (поиск по многим неосновным ключам) и средства администрирования.