Поисковая машина – это комплекс программ, предназначенный для поиска информации, обычно являющийся частью поисковой системы.Поиско́вая систе́ма, в свою очередь, представляет собой веб-сайт, позволяющий осуществлять поиск информации в Интернете.
Поисковые системы состоят из пяти отдельных программных компонентов:
• Система выдачи результатов — извлекает результаты поиска из базы данных.
• Паук — программа, которая скачивает веб-страницы.
• Краулер — программа, которая автоматически проходит по всем ссылкам, найденным на странице, и выделяет их. Следуя по найденным ссылкам, краулер осуществляет поиск новых документов, еще не известных поисковой системе
• Индексатор — разделяет страницу на части (заголовки страниц, заголовки в тексте страницы, ссылки, собственно текст и его структурные элементы и др.) и анализирует их.
• База данных — хранилище всех данных, которые поисковая система скачивает и анализирует.
Выделяют два типа поисковых машин (ПМ):
· Индексные – Google, AltaVista, Рамблер, Апорт и др
· Классификационные (каталоговые) – Рамблер, Yahoo и др.
По мнению исследователей, некоторые машины могут являться одновременно и индексными, и каталоговыми. Индексные поисковые машины индексируют информацию – заносят в свою базу данных ключевые слова той или иной страницы. Классификационные ПМ работают по принципу тематического каталога.
Поисковые машины не ищут сайт сразу при введении ключевого слова, они не просматривают сразу весь Интернет. Поиск осуществляется только в пределах собственной базы данных определенной поисковой машины. Крупные поисковики собирают информацию подобно каталогу в библиотеке. Базы данных поисковых машин постоянно изменяются.
Приоритет поисковых машин – обнаружение и индексация релевантных страниц (от англ. relevant – относящийся к делу). ПМ выдают страницы по степени релевантности, то есть точности найденной информации запросу пользователя. Ниже мы рассмотрим методы, используемые поисковыми машинами для оценки значимости веб-страниц.
Поисковые алгоритмы (математические методы программирования, сортирующие найденные результаты) каждого из поисковых сервисов уникальны. В этом можно убедиться, введя ключевое слово или фразу, например, в поисковую систему www.yandex.ru и запомнив результаты, а затем повторив то же самое на www.rambler.ru или www.google.ru. В различных поисковых машинах полученная информация будет различна. Учитывая этот факт, к поиску в различных поисковых системах следует подходить по-разному, применяя индивидуальный подход.