Релевантность ( англ. relevance ) - мера соответствия получаемого результата желаемому. В терминах поиска - это мера соответствия результатов поиска задаче поставленной в поисковом запросе. Определяет, насколько полно тот или иной документ отвечает критериям, указанным в запросе пользователя. Необходимо учитывать, что в каждойпоисковой системе работает собственная программа ( спайдер ), что индексирует веб-страницы , каждая система индексирует страницы своим особым способом и приоритеты при поиске по индексам тоже различны. Поэтому запрос по одним и тем же ключевым словам в каждой из поисковых систем порождает разные результаты.
Релевантность поиска
Это является субъективным понятием, поскольку результаты поиска, подходящие для одного пользователя, могут не подходить для другого. Основным методом для оценки релевантности является TF-IDF -метод, который используется в большинстве поисковых систем (как в интернет-поисковиках, так и в справочных системах ( MSDN ). Его смысл сводится к тому, что чем больше локальная частота термина (запроса) в документе (TF) и больше «редкость» (то есть, чем реже он встречается в других документах) термина в коллекции (IDF), тем выше вес данного документа в отношении срока - то есть документ будет выдаваться раньше в результатах поиска по данным термином. Автором метода является Gerard Salton (в дальнейшем доработан Karen Sparck Jones ).