Когда говорят об информационно-поисковой системе, подразумевают, что она использует предметный указатель. Предметный указатель позволяет отыскивать документы, касающиеся некоего предмета». Для составления предметного указателя анализируется содержание документа и определяется «предмет» или «предметы » о которых в документе идет речь. Затем названия этих предметов переводятся на информационно - поисковый язык (ИПЯ). Таким образом, мы получаем поисковый образ документа (ПОД). Проиндексировав (создав поисковые образы) все информационные ресурсы, мы получаем то, что принято называть индексом (index database) — основной массив данных ИПС.
Так как процесс поиска заключается в сопоставлении запроса пользователя с имеющимися данными, полученный запрос также должен рыть переведен на ИПЯ. После сопоставления переведенного на ИПЯ запроса и поисковых о6разов документов пользователь получает список ссылок на документы, которые соответствуют, по мнению системы, его запросу.
Как видно, поиск происходит не по тексту документов, а по их поисковым образам, составленным на ИПЯ. Поэтому ИПЯ — основная часть информационно-поисковой системы, от которой в первую очередь зависит качество системы.
В состав информационно-поискового языка входят:
· Словарь индексационных терминов — множество терминов индексирования.
· Кодовый словарь — множество кодовых терминов.
· Словарь входов,— множество входных терминов.
· Вспомогательные средства языка индексирования — средства, используемые совместно с индексационными терминами для расширения или сужения определенных понятий.