русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

Поисковые службы


Дата добавления: 2014-05-02; просмотров: 1724; Нарушение авторских прав


В попытках облегчить поиск в Web нужной информации разработаны сотни различных поисковых служб. Поисковая служба представляет собой Web-узел с интерактивной индексированной базой данных, в которой Web-узлы классифицированы, как правило, с помощью метадескрипторов. Метадескрипторы — это ключевые слова, добавленные Web-дизайнером. Согласно www.wwwmwtric.com (на этом узле приводится статистическая информация по Web) к услугам поисковых служб прибегают 85% пользователей, однако индексированы поисковыми службами лишь 20% общедоступных Web-узлов.

Первой солидной поисковой службой была Yahoo (www.yahoo.com), которая и сейчас пользуется большой популярностью. Ниже приведен список наиболее часто посещаемых поисковых служб.

  • Lycos (www.lycos.com).
  • DirectHit (www.directhit.com).
  • Excite (www.excite.com).
  • AltaVista (www.altavista.com).
  • Northern Light (www.northern light.com)-
  • Google (www.google.com).

Принцип действия большинства поисковых служб основан на анализе ключевых слов, или метадескрипторов, добавленных к HTML-страницам их разработчиками. Эти ключевые слова представляют собой технические или научные термины, по которым пользователь вручную искал бы материалы с нужной ему тематикой в реферативных журналах. Допустим, что пользователь хочет найти что-нибудь о разведении сиамских котов. В этом случае его заинтересуют страницы HTML с ключевыми словами "кот", "сиамский", "разведение" или "сиамский кот".

В поисковых службах применяются приведенные ниже компоненты.

  • Паук (spider). Программа, "путешествующая" по различным Web-узлам и собирающая индексную информацию.
  • Индексная база данных. База данных, в которой хранится индексная информация, собранная пауком.
  • Механизм поиска и выдачи результатов. Программы интерфейса между пользователями и поисковой службой, с помощью которых пользователи задают свои вопросы и получают ответы.

Некоторые поисковые службы могут в поиске ключевых слов перебирать не только метадескрипторы HTML-страниц, но и весь текст страниц. Это значительно увеличивает количество найденных страниц, но среди них будет намного больше ненужных. Пусть, например, пользователь ищет рецепт торта и поисковая служба нашла ему все страницы HTML, в тексте которых встречается слово "торт". Очевидно, что подавляющее большинство страниц будут содержать не кулинарные рецепты, интересующие пользователя, а все, что угодно, включая детективы и последние новости. Такой поиск может оказаться бесполезным, потому что в предложенных пользователю страницах HTML найти интересующие его кулинарные рецепты будет практически невозможно.



Повысить эффективность поиска можно путем правильного использования алгоритмов поисковой службы. Чаще всего в алгоритмах поиска используются логические функции И, ИЛИ и НЕТ. Вернемся к нашему примеру с тортом. Круг поиска значительно сужается, если в строке запроса ввести "торт И рецепт". В этом случае поисковая служба отбросит страницы, в которых есть торты, но нет рецептов, и страницы, в которых есть рецепты, но нет тортов.

Большинство поисковых служб не могут индексировать содержимое Web-узлов, защищенных паролем. Еще нужно учитывать, что после загрузки документа на Web-cepeep пройдет некоторое время, прежде чем его индексирует какая-либо поисковая служба. Поэтому в базах данных поисковых служб обычно нет документов, загруженных недавно.



<== предыдущая лекция | следующая лекция ==>
 | 


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 0.088 сек.