Для поиска информации в Интернет используются специальные поисковые сервера, которые содержат постоянно обновляемую информацию о Web-сайтах, файлах, e-mail адресах и других информационных ресурсах Интернета. Различные поисковые сервера могут использовать различные механизмы поиска, хранения и предоставления пользователю информации.
Поисковые сервера Интернета можно разделить на две группы: поисковые системы общего назначения и специализированные поисковые системы.
Поисковые системы общего назначенияпозволяют находить документы во Всемирной паутине по ключевым словам, которые вводятся в поле поискаи/или с помощью иерархической системы каталогов.
Поисковые машины. Автоматическое заполнение баз данных поисковых систем производится роботизированными системами (Search Engines). Специальная программа-робот, которую называют паук (spider), постоянно обходит Интернет в поисках новой информации, которую она вносит в базу данных. База данных содержит URL-адреса и проиндексированную информацию, связанную с этими адресами.
Мощная поисковая машина обходит весь Интернет за несколько дней. При этом составляется новый индекс - опись доступных ресурсов. При каждом новом цикле обхода индекс обновляется, и старые недействительные адреса удаляются.
При поиске по ключевым словам в поле поиска вводится одно или несколько ключевых слов, которые, по мнению пользователя, являются главными для искомого документа. Можно также использовать сложные запросы, использующие логические операции, шаблоны и т.д.
Каталоги. Каталоги составляются редакторами, просматривающими каждый новый сайт до его включения в индекс. В процессе наполнения каталогов могут участвовать и сами разработчики сайтов при его регистрации в поисковой системе. Каталоги обычно организованы в соответствии с предметной классификацией.
Качество систематизации сайтов при этом выше, чем у поисковых машин, но люди не могут успеть за темпами расширения и изменения Интернета: индекс популярного каталога Yahoo! содержит лишь немногим более миллиона записей.
Интерфейс каталогов содержит список разделов, в которые сгруппированы ссылки на URL-адреса наиболее важных документов. Каждая ссылка обычно аннотирована, т.е. содержит краткое описание содержания документа.
Наиболее популярными поисковыми системами общего назначения в рускоязычном Интернете (Рунете) являются Яндекс (www.yandex.ru), Rambler (www.rambler.ru) и Апорт (www.aport.ru), а в англоязычном - Yahoo! (www.yahoo.com).
Rambler является поисковой системой общего назначения для поиска в российской части Интернета (Рунете). Предоставляет возможность использования расширенного поиска с использованием языка запросов. Отслеживает популярность сайтов с помощью счетчика посещений Rambler и выстраивает их в системе каталогов по количеству посещений.
URL поисковой системы
http://www.rambler.ru
Яндекс (Yandex) является поисковой системой общего назначения для поиска в российской части Интернета (Рунете).
URL поисковой системы
http://www.yandex.ru
Апорт (Aport) является поисковой системой общего назначения для поиска в российской части Интернета (Рунете). Предоставляет возможность использования расширенного поиска с использованием языка запросов.
URL поисковой системы
http://www.aport.ru
Yahoo является поисковой системой общего назначения для поиска в Интернета. Предоставляет возможность использования расширенного поиска с использованием языка запросов.
URL поисковой системы
http://www.yahoo.com
Важными показателями качества поискового сервера являются:
- объем базы данных (количество документов);
- скорость обхода Интернета программным роботом (с этим связана скорость обновления информации в базе данных);
- алгоритм индексации (только по ключевым словам Web-страницы или по всему тексту);
- возможности расширенного поиска с использованием языка запросов;