В настоящее время в информационных сетях размещен огромный объем информации по различным направлениям деятельности. Основным хранилищем информации была и остается сеть Интернет. Основной объем информационных ресурсов в виде веб-страниц или файлов в формате html находится на веб-сайтах, размещенных на веб-серверах Интернета. Просмотр веб-страниц этих сайтов осуществляется при помощи прикладных программ браузеров (обозревателей).
Кроме того, в Интернете находится много информационных ресурсов (различных типов файлов), которые размещаются на других типах серверов, например на FTP-серверах (файлы компьютерных программ, технических описания), в архивах GOPHER (файлы текстов литературных произведений), в базах данных ARCHIE на ARCHIE-серверах, в WAIS-библиотеках (материалы в области исследований и информационных технологий), на серверах баз данных (информация о владельцах доменных имен) регистраторов IP-адресов и регистраторов доменных имён и т.д.
Быстрый рост объема информационных ресурсов привел к необходимости создания специальных поисковых средств. Поисковые системы в Интернете могут быть разделены на следующие группы: системы Web-поиска; системы поиска FTP-файлов; системы поиска в архивах Gopher; системы поиска в Usenet; каталоги информационных ресурсов; порталы информационных ресурсов.
Средства поиска информационных ресурсов в Internet подразделяют на:
- поисковые машины, системы поиска, которые осуществляют поиск по ключевым словам;
- каталоги и порталы информационных ресурсов сети, которые имеют иерархическую структуру для навигации или быстрого поиска информации не по ключевым словам, а по директориям.
Поисковая машина – это поисковый сервер, на котором установлена специальная программа, выполняющая автоматический поиск информационных ресурсов по ключевым словам в заголовках и тексте Web-страниц. К наиболее известным поисковым машинам относятся: Google, Yahoo, Alta Vista, Hot Bot, MSN Search, Yandex, Rambler, Апорт, Мета др.
Поисковые системы – это огромные базы данных слов, которые добавляются в базу при периодическом сканировании Web-страниц в пространстве Интернет. При помощи программ-роботов (пауков) поисковые системы регулярно просматривают ресурсы сети Internet.
Полученный информационный массив вместе с ссылкой на то, где находится нужное слово, хранится в виде индексных (отсортированных) файлов. При вводе ключевого слова в поисковую машину система обращается к своей базе файлов, выбирает информацию и выдает пользователю перечень Web-страниц, на которых имеются заданные пользователем ключевые слова.
Вследствие разницы в подходах к поиску в различных поисковых системах результаты их поиска не всегда адекватны запросу. Поэтому для получения наиболее полных результатов целесообразно пользоваться различными поисковыми системами или метапоисковыми машинами.
Метапоисковые машины – это системы, проводящие поиск на нескольких поисковых машинах одновременно. Примером таких метапоисковых машин является MetaBot – Российская метапоисковая система, которая осуществляет поиск через российские поисковики (Yandex, Апорт, Rambler и др.), мировой метапоиск (Northernlight, All the Web, Raging), а так же смешанный FTP-метапоиск.
Классифицировать каталоги информационных ресурсов можно по различным критериям, например целевому назначению, по характеру содержания, национально-территориальному признаку, по сферам их использования.
Обычно на главной странице каталога информационных ресурсов размещены базовые разделы рубрикатора. Рубрикатор имеет иерархическую структуру, позволяющую наиболее точно классифицировать ресурсы по их тематической направленности.
К наиболее популярным каталогам информационных ресурсов относятся: DMOZ каталог; Yandex каталог; Rambler's Top100; Yahoo Directory.