Аннотация – краткая характеристика первичного документа с точки зрения его содержания, назначения, формы и других особенностей. Носит справочный или рекомендательный характер. Служит в качестве средства информационного поиска документов.
Аннотацией (от лат. annotatio - примечание) называется связный текст, кратко характеризующий документ с точки зрения его назначения, содержания, вида, формы и других особенностей. Существует классификация аннотаций по разным признакам (целевому назначению, способу характеристики, объему, степени использования средств автоматизации и др.). При аннотировании главным объектом анализа является текст документа. Такой анализ может преследовать две разные цели:
- выявление центральной темы или предмета, рассмотрению которого посвятил этот документ сам автор, а также основных идей и фактов, связанных с этой темой или предметом;
- определение того, насколько данный документ по своему семантическому (смысловому) содержанию соответствует научным или практическим интересам определенной группы ученых и специалистов.
Результаты анализа синтезируются в некоторый комплекс понятий, который выражается и записывается на естественном языке. Для выполнения анализа и синтеза требуется знание хотя бы основ той области науки или техники, к которой относятся подвергаемые переработке документы. Высококачественное же аннотирование научных документов могут производить лишь специалисты. Аннотации используются в области библиотечного дела и библиографии, в издательском и книготорговом деле и в научно-информационной деятельности.
В любой библиотеке или в информационном центре имеющаяся в фонде литература хранится не как придется, а в строгом соответствии с информационно-поисковой системой (ИПС). Именно это условие и обеспечивает быстрый поиск документов и их выдачу читателям. Для того чтобы включить новую единицу в фонд, необходимо ее проиндексировать, т.е. сопоставить содержание текста документа с терминами языка данной ИПС. К традиционным ИПС относятся каталоги и картотеки. ИПС строится на основе информационно-поискового языка (ИПЯ). Так называется искусственный язык, предназначенный для выражения содержания документов и информационных запросов. Он строится на базе соответственного естественного языка (например, английского или русского), но обладает рядом некоторых обязательных требований. К ним относятся:
· однозначность (каждая запись на ИПЯ должна иметь только один смысл, а любое понятие должно получить средствами языка единообразную запись);
· семантическое соответствие (способность отражать с необходимой полнотой и точностью смысловое содержание документов и запросов определенной предметной области);
· открытость, дающая возможность корректировки языка.
Для каждого ИПЯ характерны своя лексика (словарный состав), базисные (аналитические) отношения, грамматика, система обозначений (алфавит), система ведения (изменения и дополнения), правила образования из простых лексических единиц (слов, рубрик, индексов) сложных или составных, а также правила интерпретации (перевода с естественного языка на ИПЯ и наоборот).
Процесс индексирования включает в себя:
· анализ содержания индексируемого материала и выбор из него лексических единиц, слов или словосочетаний, выражающих смысловое содержание текста;
· преобразование выбранных лексических единиц естественного языка в лексические единицы ИПЯ, т.е. нормализацию первых по форме и содержанию;
· формирование поискового образа документа (ПОД) или запроса с введением в него грамматических средств ИПЯ или без них. В качестве ПОД выступают сочетания предметных рубрик, индексов любой классификации (УДК, ББК и др.) или ключевых слов (дескрипторов).
Таким образом, индексирование означает кодирование по определенным правилам содержания документов для ее включения в данную ИПС.
Существуют два основных вида индексирования – систематизация и предметизация. При систематизации содержание документа или запроса выражено классификационными индексами в соответствии с правилами какого-либо классификационного ИПЯ (классификационной системы). При предметизации содержание документа или запроса выражено предметными рубриками в соответствии с правилами предметизационного ИПЯ.
При систематизации документов на первом этапе непосредственно знакомятся с документами, выявляют и отбирают их основные смысловые компоненты. Затем словесная форма по специальным таблицам классификации переводится на язык классификационных индексов. На заключительном этапе производится категориальный синтез - выявленные классификационные признаки объединяются в полном классификационном индексе.
При предметизации документа выделяют предмет (предметы) и аспект (аспекты) его рассмотрения. Затем данные смысловые компоненты формулируются в словесной форме в соответствии с принятыми правилами и принципами предметизации. На заключительном этапе предмет и аспекты рассмотрения обозначаются при помощи предметных рубрик предметного каталога данной библиотеки с необходимой и достаточной степенью адекватности. Если в словаре (списке) отсутствует предметная рубрика, позволяющая идентифицировать содержание документа, принимается решение о включении в него новой рубрики и одновременно вносятся изменения в справочно-методическую документацию.
В информатике часто оперируют термином «координатное индексирование», понимая под ним метод информационного анализа содержания документов или запросов, в результате которого лексические единицы (ключевые слова, словосочетания, рубрики и др.), извлеченные из текстов, соединяются между собой координатной (соподчинительной) связью; при этом они могут комбинироваться в любых отношениях, необходимых для более точного поиска информации.
Индексирование относится к числу «внутренних» библиотечных и информационных процессов, мало заметных постороннему глазу. Однако значение этого процесса трудно переоценить, поскольку именно он, нормализуя лексику, обеспечивает единство потоков информации в ИПС.