Машинной обработке информации предшествует ее классификация и кодирование.
Система классификации — это совокупность правил и результат распределения заданного множества объектов на подмножества (классы) в соответствии с признаками сходства или различия. Выделяемое по признаку подмножество объектов называется классификационной группировкой. Различают два метода классификации: иерархический и фасетный.
Иерархический метод классификации устанавливает между классификационными группировками иерархические отношения подчинения с последовательной детализацией их свойств: класс, подкласс, группа, подгруппа, вид и так далее. То есть заданное множество последовательно делится на подчиненные подмножества. Например, учет материалов как заданное подмножество делится на группы, подгруппы, наименование, размер. Преимущества иерархической классификации: большая информационная емкость, логичность построения. Недостаток: наличие жесткой структуры и невозможность группировки объектов по произвольному объединению признаков.
Давайте в качестве примера создадим иерархическую структуру Вуза, которая позволила бы нам сгруппировать информацию о студентах по следующим признакам: факультет, возраст, пол, семейное положение.
В данной системе на 0 уровне находится факультет, уровень 1 названия факультетов, которые выступаю в данном случае классификационным признаком, уровень 2 признак возраст, разделенный на три подгруппы, уровень 3 признак пол, распадающийся только на две группы, уровень 4 признак семейное положение, делящийся также на две подгруппы и т. д.
Глубина классификации в нашем примере 4.
Как видно из этого примера мы жестко распределили студентов согласно выбранным признакам и в случае, если у нас возникнет необходимость изменить или добавить новый признак в системе это приведет к тому, что нам понадобиться студентов перераспределять заново.
Фасетный метод классификации основан на множестве независимых признаков. Набор таких признаков может быть произвольным, что позволяет группировать объекты по любому сочетанию признаков. Например, классификация продукции “Обувь”. Признаком ее может быть “вид материала”: хромовая обувь, кожаная обувь и т. д.; “качество”: повседневная обувь, модельная обувь; “возрастной признак”: мужская, женская, детская. Преимущества фасетной классификации: большая гибкость структуры, возможность группировки и поиска по каждой совокупности признаков и др. Недостаток — сложность построения.
Давайте вернемся, к примеру, рассмотренному выше, и построим уже фа сетную систему классификации для нашего Вуза.
Сгруппируем и представим в виде таблицы классификационные признаки по фасетам. Получим:
¨ Фасет название факультета.
¨ Фасет возраст.
¨ Фасет пол.
¨ Фасет семейное положение
Структурная формула для класса примет вид KS =(Факультет, Возраст, Пол, Семейное Положение).