Лексическая базавключает классификаторы, кодификаторы, словари и тезаурусы и др. лексико-лингвистические таблицы. Они используются для ввода, обработки и вывода информации в АИС.
Классификатор— систематизированный свод (документ, словарь), отображающий закон разбиения множества объектов на классы, группы и т. д.
Кодификатор— словарь, в котором присвоены коды (символы) обозначаемым понятиям, объектам, сущностям и т. д.
Тезаурус — толковый словарь дескрипторов (слов или словосочетаний), значение которых объясняется через связи с другими лексическими единицами (дескрипторами).
Во-первых, следует понять, для чего создаются классификаторы, а во-вторых, рассмотреть их структуру и содержание. Очевидно, что огромный объем информации создается в сфере хозяйствования, т. е. производства. Поэтому очень важно представлять себе, что такое экономическая информация и как рационально ее организовать для использования в различных целях.
Экономическая информация — совокупность сведений, отражающих условия, состояния и результаты общественного производства
Для управления экономикой используется планирование, учет, контроль, регулирование, диспетчеризация и т. д. При этом техническая, технологическая, социальная и любая другая информация становится экономической, так как применяется в экономике. Совокупность таких данных, используемых с указанной целью, образует систему экономической информации.
Экономическая информация обычно носит дискретный характер и представляется буквами, цифрами, символами. Она может выражаться графиками, диаграммами и другими способами. Например, применительно к среднему предприятию можно рассматривать постоянную и непостоянную (не всегда участвующую в процессах или производную) информацию.
В состав постоянной экономической информации входит нормативная, расценочная, справочная, структурная, табличная, маршрутная информация.
К нормативной информации относятся: конструкторско-технологические нормативы на оборудование и производственные помещения, сырье, материалы, трудовые и стоимостные нормативы, нормативы складских запасов материалов и многие другие. Нормативы регламентируют состав и количественные характеристики продукции, материалов и т. д., определяют порядок выполнения работ, указывают состав технических средств и состав исполнителей. Нормативно-справочная информация заимствуется из справочников и нормативных документов.
Расценочная информация— данные о стоимости единицы продукции, материальных ресурсов, выполняемых работ. Расценочная информация утверждается соответствующими организациями.
Справочная информация— информация об относительно постоянных свойствах объектов (табельный номер сотрудника, номер цеха и т. д.).
Структурная информацияхарактеризует структурный состав объекта, т. е. последовательность вхождения каждого составляющего элемента в некоторое соединение (например, в автомобиле 40000 деталей, а данный завод изготавливает 20-25).
Табличная информация— совокупность данных, полученных в результате вычисления по соответствующим формулам и занесенных в таблицу значений переменных и выходных данных — результатов вычислений (например, таблица налогов по заработной плате и т. п.).
Маршрутная информацияотражает технологическую последовательность выполнения процесса (обработки деталей, очередность сборки и т. д.).
Вся эта информация должна быть рационально организована, структурирована, т. е. классифицирована.
Классификация— система распределения всего множества предметов или понятий по общим признакам или различиям на отдельные группы или подмножества.
Классификатор- систематизированный свод (документ), отображающий закон разбиения множества объектов на классы, группы и т. д. Это также свод кодовых обозначений классификации, наименований этих объектов и фасетов (групп) классификационных признаков объектов.
В СССР действовала система классификации экономической информации, включающая десятки миллионов наименований изделий и конструкторской документации, 1,5 млн. предприятий и организаций, 10 млн. материальных и трудовых нормативов, 1 млн. стандартов и технических условий, 70 ООО показателей финансовой, бухгалтерской, статистической и производственной технико-экономической информации. Эта система классификаторов представлена на рис. 2.10.
К настоящему времени в нашей стране разработаны общероссийские классификаторы (ОК). Ниже приводится их перечень:
1.ОК предприятий и организаций (ОКПО);
2.ОК органов государственной власти и управления (ОКОГУ);
3.ОК экономических районов (ОКЭР);
4.ОК видов экономической деятельности, продукции и услуг (ОКДП);
5.ОК специальностей по образованию (ОКСО);
6.ОК занятий (ОКЗ);
7.ОК управленческой документации (ОКУД);
8.ОК продукции (ОКП);
9.ОК информации по социальной защите населения (ОКИСЗН);
10.ОК услуг населению (ОКУН);
11.ОК стандартов (ОКС);
12.ОК профессий рабочих, должностей служащих и тарифных разрядов (ОКПДТР);
13.ОК валют (ОКВ);
14.ОК основных фондов (ОКОФ);
15.ОК изделий и конструкторских документов машиностроения и приборостроения (ОКЕСКД);
16.ОК единиц измерения (ОКЕИ);
17.ОК специальностей высшей научной квалификации (ОКСВНК) и другие.
При классификации множества выбирается определенная система кодирования, т. е. каждой позиции классификатора присваивается кодовое обозначение.
Кодирование— это перевод записи из одной формы в другую с помощью символов.
Процесс, при котором информация, выраженная в одной системе знаков, представляется в другой системе, называется кодированием. Кодирование осуществляется для экономии памяти, времени для заполнения форм, ввода и обработки документов, минимизации ошибок. Например, фамилию можно кодировать символом 1 и т. д.
Система кодирования— совокупность правил, определяющих систему знаков и порядок их использования в работе с информацией.
Кодирование должно обеспечить:
компактное и удобное представление информации;
удобство обработки информации;
сопряжения различных технических устройств и людей, работающих с кодированной информацией.
Системы кодирования разных уровней должны быть увязаны. Эта проблема может решаться с помощью машинного перекодирования, машинной подготовки данных для управления кодированием.
Системное кодирование может быть:
1.последовательным — реализуется иерархическая система классификаций;
2.параллельным — соответствует фасетной классификации. Отсутствует взаимная зависимость между группами, ее легко изменять;
3.серийно-порядковым — при наличии двух классификационных признаков объекты делят на группы. В каждой группе — порядковая система кодов, в каждой группе — серия.
Принципы кодирования:
выбирать значимость кода минимальной;
обеспечивать максимальную логичность кода;
учитывать особенности применяемых технических средств;
учитывать особенности автоматизируемого производства;
использовать существующие коды номенклатур и общих обозначений;
учитывать перспективы развития производства.
Коды могут быть разного вида и сочетания (см. рис. 2.11).
В нашей стране действует ЕСКК — единая система классификации и кодирования.
Для классификации экономической информации используют десятичную систему обозначений для выбираемых группировок признаков — рис. 2.12.
При явных преимуществах общероссийских классификаторов можно отметить, что они громоздки, шифры избыточны. Поэтому в ряде случаев целесообразно разрабатывать собственные (локальные) классификаторы и соответствующие им шифры.
Шифр— условное обозначение определенного информационного понятия. Шифр может состоять из комбинации букв, чисел или букв и чисел.
Шифры должны обеспечить возможность точной идентификации объекта, иметь по возможности меньшее число разрядов. Шифр одного и того же объекта должен быть одинаковым во всех решаемых задачах. Построение шифра должно быть оптимальным.
Например, коды органа старшего уровня образуют из действующих кодов. На уровне министерства формируется код, к которому прибавляют шифр министерства. На уровне предприятия к коду прибавляют шифр предприятия. Это упрощает процесс перекодирования.
Например, Общероссийский классификатор специальностей по образованию ОКСО (дата введения 1994-7-01) являлся составной частью ЕСКК РФ. Он предназначался для использования в процессе автоматизированной обработки и обмена информацией на всех уровнях управления хозяйством страны. Объекты классификации ОКСО — группы специальностей, области знаний, специальности среднего профессионального и высшего образования, направления подготовки в высшем образовании, специализации. Классификатор состоит из двух разделов: «Среднее профессиональное образование» и «Высшее образование». Описание объекта классификации включает три блока: идентификации, наименования и фасетов классификационных признаков.
Блок идентификации строится по иерархическому методу классификации и использует серийно-порядковый, последовательный и параллельный методы кодирования. Длина кода — 7 десятичных знаков и контрольное число (КЧ). Формула для составления кода имеет вид ХХ+ХХ+ХХ+Х+КЧ, где, например, для специальностей среднего профессионального и высшего образования 1-й и 2-й знаки — группа специальностей, 3-й и 4-й знаки — специальность, 5-й и 6-й знаки — специализация, 7-й знак — уровень подготовки. Для 7-го знака принято: 1 — специальности среднего профессионального образования, 2 — направления высшего образования, 3 — специальности высшего образования.
Блок наименования содержит наименование группы специальностей, области знаний (наук), специальности, направления подготовки или специализации.
Блок фасетов классификационных признаков указывает на группу образовательных программ по МСКО (Международной стандартной классификации образования ЮНЕСКО), включает пять признаков и строится по формуле Х+ХХ+ХХ. В формуле 1-й знак — ступень образования, 2-й и 3-й знаки — изучаемая область в рамках ступени, 4-й и 5-й знаки — группа образовательных программ в пределах изучаемой области.
Ниже приведен фрагмент из ОКСО.
1. СРЕДНЕЕ ПРОФЕССИОНАЛЬНОЕ ОБРАЗОВАНИЕ
СПЕЦИАЛЬНОСТИ СРЕДНЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
Тезаурус (дескрипторный словарь) включает, как правило, лексико-семантические алфавитные указатели и систематические указатели.
Лексико-семантические алфавитные указатели содержат дескрипторы с сопровождающими дескрипторными статьями и недескрипторы (с отсылкой «см.» к соответствующему дескриптору).
Дескрипторная статья— упорядоченный класс дескрипторов и недескрипторов (синонимов дескрипторов), связанных внеконтекстными отношениями с заглавным дескриптором.
Пример дескрипторной статьи из тезауруса КАДИПС (картографической автоматизированной документальной ИПС) представлен ниже.
добывающая промышленность
с - горная промышленность
горнодобывающая промышленность
в - промышленность (496)
н - добыча металлического сырья (500)
добыча неметаллического сырья (503)
топливодобывающая промышленность (507)
а - полезные ископаемые (72)
В дескрипторной статье введены следующие обозначения: 499, (503) и другие — коды (цифры в скобках или без скобок);
с — синоним;
в — выше (вышестоящее, подчиняющее понятие);
н — ниже (нижестоящее, подчиненное понятие);
а — ассоциация (обозначение ассоциативной связи)
Систематические указатели содержат дескрипторы, сгруппированные по тем или иным классификационным признакам (например, по содержанию, календарным периодам и т. д.).