русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

Основы информационного поиска


Дата добавления: 2013-12-23; просмотров: 11369; Нарушение авторских прав


Основным средством передачи научной информации во времени и пространстве был и продолжает оставаться письменный документ. Такая система научной связи существует с момента возникновения науки и в целом успешно выполняет свою функцию.

Возникновение системы научной коммуникации при помощи письменных документов сразу же потребовало организации промежуточных хранилищ, в которых бы последние накапливались и хранились в систематизированном виде. Это давало бы исследователю возможность производить поиск документов в любое удобное для него время.

Информационным поиском называется некоторая последовательность операций, выполняемых с целью отыскания документов, содержащих определенную информацию (с последующей выдачей самих документов или их копий), или с целью выдачи фактических данных, представляющих собой ответы на данные вопросы. Термин «информационный поиск» ввел в информатику американский математик Кэлвин Муэрс в 1947 году.

Побудительная причина информационного поиска - информационная потребность, выраженная в форме информационного запроса. Объектами информационного поиска могут быть документы, сведения о их наличии и (или) местонахождении, фактографическая информация.

Условно информационный поиск делится на четыре основных вида: библиографический, документальный, фактографический и аналитический. Необходимо иметь в виду, что они тесно взаимосвязаны между собой. Например, чтобы найти информационный источник (документ или издание), надо знать определенную совокупность библиографических данных (фактов), характеризующих его, отличающих от многих других: хотя бы от написанных тем же автором, на одну и ту же тему и т. д. Следовательно, нужно сначала осуществить библиографический поиск. И, наоборот, чтобы провести фактографический поиск в какой-либо отрасли знаний или практики, требуется сначала найти те литературные источники (документы, издания), в которых могут быть интересующие нас факты. Поэтому сначала надо провести библиографический и документальный поиск.



Виды информационного поиска:

· в зависимости от цели - адресный (формально-механический) и семантический (тематический);

· от объекта поиска - документный и фактографический;

· от степени использования технических средств - ручной или автоматизированный.

· в зависимости от функциональной роли - доминирующие/второстепенные, центральные/периферические, устойчивые/ситуативные потребности.

Все виды информационного поиска пересекаются, так как их цели и объекты часто взаимосвязаны. Например, документный и фактографический виды поиска могут быть как адресными, так и семантическими.

Информационный поиск производится при помощи информационно-поисковых систем (ИПС). ИПС - это комплекс связанных друг с другом отдельных частей, предназначенный для выявления в каком-либо множестве элементов информации, отвечающих на предъявленный информационный запрос. Массив элементов информации, в котором производится информационный поиск, называется поисковым массивом.

 

Информационный поиск осуществляется по определенным правилам, определяющим стратегию поиска, т.е. способы достижения оптимального результата. Стратегия информационного поиска зависит от типа поисковой задачи, критериев выдачи и характера диалога между потребителями информации и ИПС.

В общем случае процедура информационного поиска состоит из четырех этапов:

· уточнения информационной потребности и формулировки запроса

· определения совокупности держателей информационных массивов

· извлечения информации из информационных массивов;

· ознакомления пользователя с полученной информацией и оценки результатов поиска.

Наиболее эффективный метод поиска документов, содержащих научную информацию – прочитать каждый документ некоторой библиотеки. Но такой способ практически неосуществим, поскольку число документов обычно бывает слишком большим, чтобы все их можно было прочитывать при каждом информационном запросе. Поэтому приходится использовать другой, менее эффективный метод, при котором информационный поиск производится не по самим текстам документов, а по кратким характеристикам содержания или определенным внешним признакам документов. Для этого каждый документ снабжается поисковым образом документа (ПОД) – характеристикой, в которой кратко выражается основное смысловое содержание документа. В виде такой же краткой характеристики – поискового предписания или поискового образа запроса (ПОЗ) – должен быть сформулирован и информационный запрос. Благодаря этому процедура информационного поиска может быть сведена к простому сопоставлению ПОД с заданным ПОЗ. Если ПОД в необходимой и достаточной степени совпадает с ПОЗ, считается, что этот документ отвечает на информационный запрос. Такое сопоставление оправдано лишь тогда, когда поисковый образ и поисковое предписание формулируются в терминах одного и того же языка, и притом такого, в котором каждая фраза допускает одно и только одно толкование.

В ПОД в краткой форме выражается лишь основное смысловое содержание документа. Поэтому такой метод не может обеспечить отыскания в библиотеке всех документов, содержащих требуемую информацию. Кроме того, в числе найденных документов могут быть такие, которые фактически не отвечают на данный информационный запрос. Эти документы образуют так называемый «поисковый шум».

Важно иметь в виду, что информация, содержащаяся в научных документах, объективно подчиняется закону рассеяния. Полнота и точность поиска представляют собой конкурирующие показатели: повышение одного из них ведет к снижению другого. Увеличивая полноту поиска, мы неизбежно уменьшаем его точность и наоборот, увеличивая точность поиска, уменьшаем его полноту.

Эффективность информационного поиска определяют показатели, характеризующие нахождение релевантных документов. Они делятся на семантические (точность и полнота поиска, коэффициент информационного шума и коэффициент потерь) и технико-экономические (оперативность поиска, стоимость и трудоемкость поиска).

С проблемой информационного поиска раньше всего столкнулись библиотекари. Для того, чтобы читатели могли находить в фондах библиотеки, интересующие их документы, в ней создаются различные каталоги и указатели.

Например, в одной из крупнейших библиотек древности - в Александрийской библиотеке - к 47 г. до н.э. насчитывалось около 700 тыс. томов (свитков папируса). Составленный Каллимахом каталог к фондам этой библиотеки (примерно в 250 г. до н.э.) имел объем 120 томов. В качестве основных элементов книгоописания в этом каталоге использовалось имя автора и заглавие произведения. Если произведение не имело заглавия, то Каллимах приводил его начальные строки.

Простейшим ПОД является его заглавие. По заглавию книги или статьи читатель в большинстве случаев может судить о том, представляет ли для него интерес эта книга или статья и стоит ли с ней знакомиться подробней.

Аннотация и реферат документа также суть его поисковые образы. С увеличением объема реферативных журналов (РЖ) число помещаемых в них аннотаций и рефератов стало настолько большим, что РЖ пришлось снабжать дополнительным справочным аппаратом - системой указателей, значительно облегчающих для читателей решение информационно-поисковых задач. Таким образом, РЖ, а также РЖ с системой указателей - это простейшие документальные ИПС, рассчитанные на индивидуальное использование.

Условия поиска:

Цель поиска – разыскать основные документы и издания по заданной теме.

Предмет поиска – только по сформулированной теме.

Вид литературы – книги, статьи, стандарты, справочники и т.д.

Метод поиска – использована вся совокупность существующих методов поиска.

Хронологический охват – определяется за какой период ведется поиск.

Географический охват – информационные источники, изданные в нашей стране, посвященные российским регионам, переведенные с иностранных языков и изданные за рубежом.

 

Полнота поиска – определяются необходимые издания: описывающие тему полностью или частично, отдельные процессы, вопросы.

Интенсивность поиска – разовый, многоразовый, постоянный.

Такая конкретизация способствует большей целенаправленности, глубине, полноте и эффективности информационного поиска в каждом конкретном случае его использования.

Следует четко определить основные этапы информационного поиска и особенности каждого из них. В самом общем виде процесс информационного поиска можно разделить на следующие этапы:

формулирование задачи поиска;

разработка рабочей программы поиска;

реализация поиска;

оформление результатов поиска.

 

Формулирование задачи поиска чаще всего выполняется в виде тематической рубрики (ключевых слов). Формулирование задачи позволяет определить область и особенности используемой литературы, облегчить составление программы поиска.

Программа поиска должна максимально развернуть и конкретизировать поставленную задачу, определяя: объект, виды и методы, возможные направления, необходимые ограничения поиска – тематические, хронологические, языковые, жанровые и т. п., возможные объективные и субъективные затруднения, степень полноты, форму представления результатов поиска.

 

В качестве примера составим план поиска применительно к теме «Атомные электростанции».

Объект поиска: определяем основные области общественной деятельности (науки), объектом и результатом изучения, которых является эта тема: электроэнергетика, ядерная технология и т.п.

Виды и методы поиска: библиографический поиск, все возможные методы информационного поиска.

Основные направления поиска: определяем основные библиотеки, библиографические пособия, периодические издания, информационные издания, полнотекстовые БД, ресурсы Интернета.

Необходимые ограничения поиска – только статьи и монографии на русском языке, выпущенные с 1970 г. по настоящее время.

Форма представления результатов – список литературы по заданной теме.

 

В процессе реализации информационного поиска следует руководствоваться рядом общих методических рекомендаций. Так, характер поиска всецело определяется содержанием поставленной задачи. И в этом отношении важно различать, что сначала поиск как бы привязан к теме и цели детальной, всесторонней разработки ее плана, когда особенно необходим широкий охват информационных источников литературы.

 

Следовательно, сначала в большей мере используется библиографический и документальный виды поиска. И лишь затем информационный поиск конкретизируется, ограничивается непосредственным содержанием решаемой задачи. На этом этапе преобладает фактографический поиск. В тоже время, на протяжении всего процесса информационного поиска следует сочетать различные вилы и методы поиска в двух основных направлениях: с одной стороны, от общих библиографических пособий к отдельным источникам и содержащимся в них фактам, а с другой, – от отдельных фактов и источников к общим библиографическим пособиям.

 

В каждом конкретном случае важно четко определить исходную точку поиска в системе информационного обеспечения. Например, предпочтительнее вести поиск в обратнохронологическом порядке, т. е. с новых пособий и источников, по необходимости последовательно углубляясь в историю. Или начинать с того, что уже известно, имеется под руками или легко доступно, т. е. с каталогов библиотеки университета. И лишь затем обращаться в другие библиотеки, информационные центры.

 

 

Вопросы для самоконтроля:

Что такое информация?

Назовите виды информации.

Что такое социальная информация?

Приведите определение документа. Виды документов.

Виды учебных изданий. Виды научных изданий.

Основные компоненты аппарата книги.

Что такое аналитико-синтетическая переработка документов?

Что такое библиографическая запись?

Назовите обязательные элементы библиографической записи.

Аналитическое библиографическое описание.

Методы аналитико-синтетической переработки документов.

Приведите определение информационного поиска. Назовите этапы информационного поиска.

Что такое поисковый образ документа?



<== предыдущая лекция | следующая лекция ==>
 | Планирование и диспетчеризация потоков.


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 0.005 сек.