русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

Информационно-поисковая СУБД «ПОИСК»


Дата добавления: 2015-08-06; просмотров: 1099; Нарушение авторских прав


 

Для хранения данных докумен­тального типа в САПР используют СУБД типа ИПС.Характерным представителем СУБД такого типа явля­ется СУБД «ПОИСК».

Система управления базой данных «ПОИСК» предо­ставляет пользователям следующие возможности:

1) ввод данных с экрана дисплея или в пакетном ре­жиме;

2) корректировку и добавление новых данных;

3) доступ к БД в интерактивном режиме посредством языка запросов;

4) обеспечение секретности информации с помощью паролей пользователей.

Организация базы данных.База данных для СУБД «ПОИСК» есть упорядоченное множество информацион­ных записей. Каждая из записей состоит из полей, соот­ветствующих частям документа, и представляет собой символьные строки.

Например, для приложений САПР записям будут со­ответствовать тексты проектов, ТЗ, руководящих мате­риалов, стандартов и т. д. Поля же будут соответство­вать разделам документов, таким, как название метода, дата разработки, программная реализация, состав ППП и др.

В СУБД «ПОИСК» может существовать неограни­ченное количество БД «ПОИСК», каждая включает в себя однородные записи.

Каждая запись состоит из пронумерованных полей фиксированной или переменной длины. Поля фиксиро­ванной длины применяются для хранения данных, содер­жащих заранее определенное и постоянное количество символов, например год издания, код ГОСТа, порядко­вый номер документа, тип ЭВМ. Поля переменной длины предназначены для хранения таких данных, как назва­ние документа, краткая аннотация, организация-разра­ботчик, текст самого документа.

 

■ Примечание. В СУБД «ПОИСК» термин «поле» соответст­вует введенному ранее термину «элемент данных».

 

Поля нумеруются по порядку, каждому полю ставит­ся в соответствие двухбайтовая метка. Пользователь мо­жет обращаться к содержимому поля, указывая его по­рядковый номер.



Допускается выделение подполей. Подполя внутри поля выделяются с помощью специальных двухбайтовых разделителей: состоящих из знака логического отрица­ния « » и буквы или цифры.

 

■ Примеры обращения к полям и подполям записей. Примерами таких обращений могут служить:

TEXT 16 — к полю 16

TEXT 19 ( 5) — к подполю 5 поля 19

TEXT 19 ( A) — к подполю А поля 19

Каждая база данных состоит из нескольких машин­ных файлов на устройствах прямого доступа (НМД). Эти файлы логически связаны между собой. Основной файл MAIN FILE является файлом прямого доступа и

содержит полный набор записей в специальном внутрен­нем формате хранения. Доступ к записям в подобных файлах осуществляется передачей процедуры доступа физического адреса записи на НМД. Для экономии места на диске записи располагаются на нем одна за другой. Поскольку записи могут иметь разную длину (из-за наличия полей переменной длины), вычислить ка­ким-либо образом физический адрес записи, исходя, на­пример, из ее порядкового номер, нельзя. Поэтому адрес каждой записи хранится в специальном файле, получив­шем название файла перекрестных ссылок, CROSS — PEFFERENCE. Файл обеспечивает связь порядкового номера записи с физическим адресом этой записи на дис­ке. Использование этого файла позволяет перейти к дос­тупу к записям по их порядковым номерам.

Файл транзакций TRANSACTION используется для хранения вновь поступивших записей перед их включе­нием в основной файл. Новые записи хранятся в этом файле до тех пор, пока специальные программные сред­ства не проверят соответствие новой записи существую­щим описаниям. Кроме того, в файле транзакций копи­руются записи, подлежащие модификации. Модифициро­ванная запись также подвергается проверке на соответ­ствие описанию. В случае отсутствия ошибок новая или модифицированная запись включается в основной файл. Подобная организация обеспечивает более высокую сте­пень целостности БД.

Описание структуры каждой записи хранится в таб­лице FDT определения полей, где указаны номер каждо­го поля, его длина и кратность. Для поля могут быть определены также правила проверки соответствующего данного при вводе и формат для вывода на печать или дисплей.

Поиск документов. В состав записей могут входить ключевые слова или фразы, используемые для поиска соответствующего документа. Для выделения в тексте этих элементов-дескрипторов используют соответствую­щие управляющие символы. Поиск документов в СУБД «ПОИСК» осуществляется указанием дескрипторов или их связанной совокупности.

По значениям дескрипторов в СУБД «ПОИСК» стро­ятся инвертированные файлы. Запись инвертированного файла состоит из значения дескриптора и списка номе­ров записей, соответствующих этому значению. Пусть в записях основного файла с порядковыми номерами 18,

204, 766 и 1039 содержится ключевая фраза «ИО САПР», Тогда запись инвертированного файла содержит фразу «ИО САПР» и цепочку из указанных номеров докумен­тов. Поскольку для другого слова цепочка номеров мо­жет оказаться более длинной или более короткой, записи инвертированного файла имеют переменную длину.

В СУБД «ПОИСК» существует возможность автома­тического контроля вводимых в инвертированный файл дескрипторов с целью исключения из него слов, бессмыс­ленных с точки зрения доступа, например предлогов. Программа, осуществляющая подобный контроль, может также анализировать формы одного и того же слова, приводя их к одному виду с целью исключения дублиро­вания записей в инвертированном списке. В некоторых случаях возникает необходимость группирования отдель­ных дескрипторов. Например, понятие «ЕСПД» объеди­няет совокупность ГОСТов по программной документа­ции. Для дескриптора ЕСПД в инвертированный файл новая запись не будет вводиться, чтобы избежать дубли­рования. Для хранения обозначений подобного рода ве­дется файл группировки ANY — FILE. Если в этом фай­ле точка входа найдена, тогда соответствующие элемен­там данной группы списки номеров объединяются.

Язык запросов СУБД «ПОИСК» основан на булевой алгебре, используемой для описания логических опера­ций над множествами записей, определяемыми значения­ми дескрипторов. Ниже приведен состав логических опе­раций:

OR — логическое ИЛИ. Операция определяет объеди­нение нескольких классов, обозначается символом «*». Если двум дескрипторам А и В соответствуют два класса документов, то результатом операции А*В будет класс, состоящий из документов, содержащих дескриптор А, или дескриптор В, или оба дескриптора. Данная опера­ция расширяет область поиска и соответственно число документов, получаемых на выходе.

AND— логическое И. Операция осуществляет пере­сечения двух классов, обозначается символом « + ». Так, результатом операции А + В будет класс документов, од­новременно содержащих оба дескриптора. Например, запрос на поиск документов об операционных системах коллективного доступа можно написать так:

 

ОПЕРАЦИОННЫЕ СИСТЕМЫ + КОЛЛЕКТИВНЫЙ ДОСТУП


NOT— логическое отрицание. Операция обозначается символом « ». В результате выполнения операций А В будет получен класс документов, включающих дескриптор А, но не включающих дескриптор В.

Для описания сложных последовательностей логиче­ских операций используются скобки по правилам ал­гебры.

В результате исполнения запроса пользователь перво­начально получает в виде ответа последовательность но­меров записей основного файла, удовлетворяющих его поисковому предписанию. Если число номеров слишком мало или велико с точки зрения пользователя, то он, мо­дифицируя свой запрос, может увеличить или соответст­венно уменьшить область поиска. По окончании всех ите­раций пользователь имеет возможность считать с экрана дисплея или выдать на печать интересующие его записи. В дополнение к существующим конструкциям языка запросов в СУБД «ПОИСК» существуют возможности для анализа текста документов, уже отобранных в ре­зультате выполнения запроса.

Существуют три оператора анализа текста:

1) логический оператор (позволяет отобрать доку­менты, содержащие заданный текст в заданном поле), например

TEXT 24 «АССОЦИАТИВНЫЙ».

В результате выполнения оператора будут отобраны документы, содержащие слово АССОЦИАТИВНЫЙ в 24-м поле;

2) арифметический оператор (позволяет отобрать до­кументы, в которых содержимое определенных позиций удовлетворяет заданным арифметическим условиям), например

TEXT 00 + 6 > «1975»

Будут отобраны документы, в которых данное, распо­ложенное начиная с седьмой позиции поля 00, удовлетво­ряет условию «данное > 1975»;

3) оператор наличия или отсутствия поля, например:

TEXT 20P

(отбираются документы, где есть данное в поле 20; Р — PRESENCE — присутствие),

TEXT 10A

(отбираются документы, где отсутствует поле 10; А — ABSENCE — отсутствие).

При работе с СУБД «ПОИСК» пользователь форми­рует запрос с помощью вышеописанных операторов. В общем случае запрос состоит из двух частей: в первой части перечисляются значения дескрипторов, соединен­ных знаками операций булевой алгебры; во второй части содержатся спецификации, определяющие порядок и форму отображения записей на дисплей пли печать. СУБД осуществляет поиск каждого из дескрипторов в инвертированном файле с целью определения множеств номеров записей. В соответствии с запросом выполняют­ся операции над множествами записей, в результате ко­торых формируется результирующий список номеров записей, удовлетворяющих запросу. Поиск физических адресов происходит по номерам записей в файле пере­крестных ссылок. Затем информация, считанная из ос­новного файла, преобразуется в соответствии со специ­фикациями второй части запроса в вид, необходимый для выдачи либо на экран дисплея, либо на печать.

 



<== предыдущая лекция | следующая лекция ==>
СУБД «СЕТОР» | Проблемы комплексирования.


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 0.034 сек.