Современные системы обработки информации (СОИ) выполняют преобразование больших массивов данных. Синонимом понятия «данные» служат термины «информация» и «сведения». Как показал опыт разработки и эксплуатации СОИ, способы хранения и обработки данных оказывают решающее влияние на показатели функционирования системы в целом, ее практическую эффективность. Сказанное относится и к САПР, оперирующим с большим числом данных различного типа и назначения. Систематическая организация данных и способов их обработки осуществляется в банках данных.
Банк данных (БНД) — совокупность базы данных и системы управления базами данных.
База данных (БД) — структурированная совокупность данных. Наименьшая единица описания данных называется элементом описания. Совокупность элементов описания, объединенных отношением принадлежности к одному описываемому объекту, называется записью. Если элементы описания соответствуют отдельным свойствам объекта, то запись описывает объект в целом. Например, код типа микросхемы, логическая функция, мощность потребления, коэффициент разветвления в совокупности составляют запись и описывают свойства конкретного объекта — микросхемы.
Система управления базами данных (СУБД) состоит из языковых и программных средств, предназначенных для создания и использования базы данных прикладными программами, а также непосредственно пользователями-непрограммистами.
Применение банков данных позволяет решить следующие проблемы организации и ведения больших массивов
52 информации: 1) сокращение избыточности; 2) обеспечение целостности; 3) разграничение доступа; 4) обеспечение независимости представления данных.
Избыточность вызывается наличием разных форм представления одних и тех же данных, размножением части данных для дальнейшего использования прикладными программами, повторными записями одинаковых данных на различных физических носителях информации.
Целостностью называется свойство БД в любой момент времени содержать лишь достоверные данные. Наличие избыточных, противоречивых и неверно составленных данных нарушает целостность БД.
Для сокращения избыточности производится объединение одинаковых по смыслу, но имеющих различный тип данных в единую БД с приведением к общему, стандартизованному виду. Процесс объединения данных, используемых различными пользователями, в одну общую БД называется интеграцией базы данных.
Однако каждый конкретный пользователь должен получить доступ лишь к некоторому подмножеству данных из БД, необходимых для выполнения своих прикладных программ. Одновременно с этим обеспечивается режим секретности и повышается степень защищенности данных от несанкционированного доступа.
Одним из важнейших преимуществ применения БД является возможность обеспечения независимости представления данных в прикладных программах от типов запоминающих устройств и способов их физической организации. В основном это достигается построением двух уровней представления данных: логического и физического.
На логическом уровне данные представляются в виде, удобном для использования в прикладных программах или непосредственно проектировщиками.
Физический уровень представления данных отражает способ хранения и структуру данных с учетом их расположения на носителях информации в запоминающих устройствах ЭВМ.
Важнейшим понятием в БНД является модель данных — формализованное описание, отражающее состав и типы данных, а также взаимосвязи между ними. Модели данных классифицируются по ряду признаков.
В зависимости от объема описываемой информации на логическом уровне различают внешнюю и внутреннюю модели данных. Внешняя модель данных (логическая подсхема) описывает структуру информации, относящейся к некоторой конкретной процедуре или к группе родственных проектных процедур.
Внутренняя логическая модель данных (логическая схема) объединяет все подсхемы БД.
По способам отражения связей между данными на логическом уровне различают модели — иерархическую, сетевую и реляционную. Модель называют сетевой, если данные и их связи имеют структуру графа. Если структура отражаемых связей представляется в виде дерева, то модель называют иерархической. Представление данных в форме таблиц соответствует реляционной модели данных.
Задание модели данных в БД осуществляется на специальном языке описания данных (ЯОД). Иногда в ЯОД выделяют языки описания данных для подсхемы (ЯОД— ПС) и для схемы (ЯОД—С).
Язык описания данных представляет собой совокупность директив, построенных в соответствии с выбранной моделью данных.
Примечание. Несмотря на то что ЯОД ориентирован на логический уровень, в него, как правило, включаются директивы, позволяющие управлять расположением данных на внешних носителях.
Прикладные программы, использующие БНД, записываются на некотором алгоритмическом языке (например, ФОРТРАН, ПЛ/1, ПАСКАЛЬ), называемом включающим языком. Для обеспечения взаимодействия с БНД в эти программы должны быть введены операторы обращения к СУБД.
Совокупность операторов обращения к СУБД из прикладной программы составляет язык манипулирования данными (ЯМД). Основные операции с данными, выполняемые средствами ЯМД, следующие:
1) поиск информации по заданным поисковым признакам в БД;
2) включение в БД новых записей;
3) удаление из БД лишних или ненужных в дальнейшем записей;
4) изменение значений элементов данных в записях. Как правило, операторы ЯМД реализуются во включающем языке с помощью оператора CALL и выполняют обращения к необходимым подпрограммам СУБД. Непосредственная запись операторов ЯМД во включающем языке используется реже. При этом необходима предтрансляция, в ходе которой операторы ЯМД заменяются эквивалентными группами операторов включающего языка. Затем выполняется окончательная трансляция прикладной программы. В результате появляется возможность осуществить как синтаксический, так и семантический контроль правильности обращения к системе управления базами данных.
Банк данных — сложная информационно-программная система, функционирование которой невозможно выполнить полностью в автоматическом режиме. Контроль над ее состоянием и управление режимами осуществляется человеком либо группой лиц, называемых администратором банка данных. Администратор, прежде всего, составляет внешние и внутреннюю модели данных, управляет размещением информации на физических носителях. Второй важнейшей его обязанностью является поддержание, целостности БНД. Для этого администратор выполняет восстановление БД после сбоев аппаратуры, запись и храпение копий, ведение системного журнала, где фиксируются все изменения, вносимые в БД, устранение избыточности данных и др.
Рис. 2.1. Схема взаимосвязи СУБД с прикладными программами:
ППа, ППб — прикладные программы пользователей а и б; РОа, РОб — рабочие области пользователей а и 6: ВШа, БШй — внешние модели данных пользователей а и б; ВН — внутренняя логическая модель данных; СВ — системный буфер
Взаимосвязь БД с прикладными программами представлена на рис. 2.1. Прикладные программы ППа и ППб пользователей а и б обращаются с запросами к СУБД, которая, пользуясь информацией о конкретной внешней модели и основываясь на описании логической схемы БД, формирует обращение к программным средствам того или иного метода доступа в составе ОС. Полученные данные поступают вначале в системный буфер, а затем помещаются в доступную пользователю рабочую область. Таким образом, СУБД можно рассматривать как некоторую надстройку над ОС, через которую происходит общение прикладного пользователя с массивами информации.
Совокупность модели данных и операций, определенных над данными, называется подходом. В соответствии смоделями данных различают реляционный, сетевой и иерархический подходы. Так как подход лежит в основе построения СУБД, различают реляционные, сетевые и иерархические СУБД. В настоящее время наибольшее распространение получили иерархические и сетевые СУБД (это объясняется возможностью обеспечить быстрый доступ к данным). Однако реляционные СУБД, несмотря на трудность их программной реализации, позволяют более удобно для пользователя описать структуру данных и манипулирование ими.
Тип организации СУБД определяется также степенью структурированности записей в составе БД. Сильноструктурированная запись — запись, построенная в соответствии с фиксированным, заранее определенным форматом всех элементов описания.
К таким данным относятся, например, сведения о микросхемах (см. табл. 2.2).
Фактографические СУБД — СУБД, предназначенные дли хранения сильноструктурированных записей. Однако не все данные могут быть сильноструктурированными. Например, в тексте ТЗ на проектирование могут быть выделены лишь элементы, соответствующие заголовку, году издания, организации-разработчику и всему остальному тексту, содержащему информацию символьного типа переменной длины. Такие записи называют слабоструктурированными, а соответствующие СУБД — документальными или информационно-поисковыми (ИПС). И САПР находят применение СУБД обоих типов.
Организация технического обеспечения САПР оказывает влияние на структуру информационного обеспечения п в первую очередь баз данных. Если БД сконцентрирована в одном узле вычислительной сети, то она намывается сосредоточенной, в противном случае — распределенной. Если информационное обслуживание с помощью БД относится ко всей САПР, то БД называют общей (интегрированной или центральной), а если к отдельной проектирующей подсистеме САПР или к отдельному пакету прикладных программ, то локальной БД.
Основные проблемы в организации распределенных и локальных БД заключаются в разработке мероприятий ни обеспечению целостности данных, своевременному обновлению информации и организации оперативного обмена между ними.