ГОСТ Р ИСО 22274-2016. Национальный стандарт Российской Федерации. Системы управления терминологией, базами знаний и контентом. Концептуальные аспекты разработки и интернационализации систем классификации
5.4. Принципы структурирования
5.4.1 Общие положения
Несмотря на то, что в подавляющем большинстве существующих систем классификации используется не какой-то исключительно один из описанных ниже методов, а их комбинация, все же могут быть определены следующие основные принципы построения классификационных систем:
- перечислительный;
- фасетный;
- фасетно-перечислительный (с входным классом).
Никакого общего правила структурирования системы классификации не существует; решение по этому вопросу должно приниматься в каждом конкретном случае в соответствии с требованиями, которые вытекают из предполагаемой сферы применения. Для выбора конкретной структуры необходимо определить:
- принцип структуризации;
- использование свойств (обязательное или факультативное);
- свойства на любом уровне или только на финальном (листовом) уровне.
Кроме того, в течение всего периода использования системы классификации может возникать потребность в изменениях уже существующих структур.
5.4.2 Перечислительные системы классификации
В перечислительных системах классификации предпринимается попытка перечисления всех возможных объектов, принадлежащих определенной области применения. Во многих случаях для такого представления используются иерархические структуры, но иногда перечислительные схемы могут представляться простыми неструктурированными совокупностями объектов.
Примечание 1 - Более подробное рассмотрение перечислительных систем классификации проводится в [26].
При построении иерархических структур используется нисходящий метод, при котором процесс разбиения приводит к созданию ряда классов в порядке их подчиненности. Таким образом, число подклассов любого класса может потребовать ограничения - для удобства их обработки целевой пользовательской аудиторией системы классификации.
Примечание 2 - Последовательная соподчиненность классов порождает иерархическую структуру классификационной системы, в силу чего перечислительные системы классификации называются также иерархическими.
Примечание 3 - В рамках перечислительных систем классификации объект может классифицироваться только в том случае, если он явным образом покрывается областью применимости одного из классов системы. Перечислительные системы классификации могут, следовательно, требовать большего количества классов, чем фасетные системы, так как для каждого класса требуется представление всех возможных сочетаний составляющих характеристик. Кроме того, возможно, что такие составляющие характеристики класса, как "неполный", будут требовать частого повторения. Таким образом, перечислительная система классификации представляет своеобразный компромисс между чрезмерно большим числом ее классов и степенью ее завершенности. Полномасштабная перечислительная система классификации часто бывает очень сложной по своей природе, и принципы ее построения могут не поддаваться определению.
Примечание 4 - Такие системы классификации часто включают в себя общие классы типа "прочие" для объектов, которые не могут быть отнесены ни к какому другому классу с более точным наименованием.
--------------------------------
<а> Данный продукт имеется в широкой продаже. Информация о нем приведена исключительно для удобства пользователей настоящего документа и не может восприниматься как одобрение этого продукта со стороны ИСО.
Примечание - Этот рисунок служит только иллюстративным целям и не может претендовать на роль полноценной системы классификации напитков.
Рисунок 2 - Пример перечислительной системы классификации
5.4.3 Фасетные классификационные системы
Фасетные системы классификации позволяют относить объект к множеству классификаций. Объект может характеризоваться любой комбинацией классов из фасетов.
Утверждение "В фасетных системах классификации не существует класса лексического ввода, общего для всех фасетов" следует понимать как указание на то, что такой класс труднодостижим. Однако для конкретной цели вполне возможно наличие "класса лексического ввода", который позволяет реагировать на потребности рынка.
Более подробную информацию о фасетных системах классификации можно найти в работе [26].
Как правило, в фасетных системах классификации для выражения определенного разнообразия объектов требуется меньше классов, чем в перечислительных классификациях, однако некоторые затруднения создает необходимость предотвращения абсурдных комбинаций классов.
Классы внутри фасетов могут образовывать одноуровневые или многоуровневые иерархические структуры.
Преимущество фасетных систем классификации состоит в том, что во многих предметных областях классы фасетной классификации имеют определенные общие типы характеристик. Такие общие характеристики могут группироваться в фасеты. Фасеты должны быть ортогональными, т.е. области их применения не должны пересекаться.
В фасетных системах классификации не требуется наличия вводного класса, общего для всех фасетов, однако такой класс может оказаться необходимым для обеспечения большего удобства использования классификационной системы. Все вместе взятые фасеты образуют систему классификации и таким образом имеют общую область применимости; и наоборот, при удалении любых ее фасетов фасетная классификация должна рассматриваться как несовместимая.
Примечание 1 - Многие объекты современных технологий обладают чрезвычайно большим разнообразием. В таких случаях применение перечислительного метода будет делать системы классификации необычайно громоздкими и неуправляемыми, тогда как фасетный метод классификации помогает сократить масштабы классификационной системы и тем самым сохранить ее удобство для пользователей.
Примечание 2 - Хотя различные фасеты не зависят друг от друга (ортогональны), они принадлежат к одной и той же системе классификации и потому имеют общую область применимости, определяемую этой системой; их раздельное использование может привести к противоречиям.
Пример 1 - Конфигурации современных автомобилей высшего класса насчитывают миллионы вариантов комплектации. Для сохранения удобства систем управления заказами для клиентов используется фасетный метод классификации, при котором покупатель может самостоятельно выбрать различные интересующие его аспекты - такие как цвет, мощность двигателя или дизайн интерьера.
Фасетный метод может быть сведен к свойствам классов в рамках классификационной системы. В таких случаях классы внутри перечислительной структуры могут квалифицироваться по различным наборам свойств.
Пример 2 - Системы классификации промышленных изделий могут включать в себя многочисленные фасеты, образованные родственными наборами характеристик для идентификации, выбора материала изготовления, информации о жизненном цикле и др.
Пример 3 - В нотации классификации двоеточием CC (Colon Classification) используются фасеты. Ниже показано использование фасетов CC на примере классификации сложного объекта, в рамках которой объект "Проектирование подводных лодок США в 20-м веке" сначала должен быть проанализирован программой классификатора по отдельным компонентам: центральное понятие (подводная лодка), процесс (проектирование), место (США), время (20-й век). Затем необходимо обратиться к системе классификации для выявления способа записи каждого из выделенных понятий. Далее найденные элементы нотации должны быть объединены в законченную запись. В результате записи фасетов будут выглядеть следующим образом:
"D5254" Подводная лодка (буква D обозначает разработку основных классов, 5254 обозначает лодку); "4" Разработка в классе D (проектирование);
"73" США;
"N" 20-й век.
Законченная запись вместе со связующими знаками примет вид: "D5254:4.73'N" [26].
Пример 4 - В рамках УДК в настоящее время пересматривается класс 1 "Философия". Одним из пересматриваемых шагов является идентификация фасетов, необходимых для надлежащего выражения содержательной стороны философских знаний.
Идентифицированы следующие фасеты [24]:
Отрасли. Области;
Системы. Школы. Традиции. Периоды. История;
Точки зрения. Позиции. Доктрины. Подходы. Теории. Отношения в философии. Типология систем. Измы;
Темы. Специальные философские дисциплины. Области философского знания. Специализация по философским предметам;
Разработка. Взаимосвязи; Практика. Метод. Аргументация;
Применения. Прикладная философия;
Философы. Пропагандисты. Личность и профессия философа; Источники. Материалы.
Пример 5 - Фасетная система классификации может содержать общие фасеты, которые применимы к любому основному классу системы; примерами могут служить фасеты времени и места.
- родовое отношение;
- партитивное отношение
--------------------------------
<а> Данный продукт имеется в широкой продаже. Информация о нем приведена исключительно для удобства пользователей настоящего документа и не может восприниматься как одобрение этого продукта со стороны ИСО.
Примечание - Этот рисунок служит только иллюстративным целям и не может претендовать на роль полноценной системы классификации вин.
Рисунок 3 - Пример фасетной системы классификации
5.4.4 Перечислительные и фасетные системы классификации
Сочетание перечислительного метода классификации с фасетным во многих случаях дает определенные преимущества. На более высоких уровнях системы классификации может использоваться перечислительный метод - для сужения областей применимости отдельных классов до размеров, поддающихся управлению. На более низком уровне используются фасетные методы - для четкого определения характера понятий финальных (листовых) классов системы классификации.
В противоположность чисто фасетным классификационным системам фасеты, которые совместно образуют ветвь системы классификации, имеют общий входной класс.
Пример 1 - На рисунке 4 понятие "Вино" обозначает вводный класс фасетной ветви "Напитки" в системе классификации.
Пример 2 - УДК базируется на перечислительном методе (десятичной классификации Дьюи), но имеет множество фасетов, дополняющих основные структуры.
- родовое отношение;
- партитивное отношение
Примечание - Этот рисунок служит только иллюстративным целям и не может претендовать на роль полноценной системы классификации вин.
Рисунок 4 - Пример перечислительно-фасетной системы
классификации
5.4.5 Классы и свойства в рамках систем классификации
Основой всех классов системы классификации являются характеристики, которые могут быть выражены явно или неявно. Явно выраженные характеристики называются свойствами. Таким образом, можно сказать, что система классификации, в которой характеристики не выражаются явно, не имеет детализации свойств (см. рисунок 5).
Пример 1 - ИСО 13584-42:2010 [9] определяет модель данных для классификационных систем с перечислительной структурой, несущей свойства на каждом уровне.
Классы системы классификации могут не иметь явно выраженных определений. Определения классов выражаются, как правило, неструктурированным естественным языком. Если система классификации не имеет свойств, то различия между классами могут выводиться из идентификаторов классов, из местоположения класса в классификационной системе или иногда посредством интерпретации определений классов.
В системах классификации с детализацией характеристик каждый класс сопровождается набором свойств, которые представляются в структурированной форме. Поэтому области применимости классов могут выводиться из их свойств. Благодаря структурированной форме представления эти свойства машиночитаемы, что облегчает их автоматическую обработку как при поиске, так и при каталогизации. Кроме того, системы классификации могут содержать определения классов, выраженные на естественном языке. Такое определение класса должно быть совместимо с его свойствами, то есть свойства класса не должны вступать в противоречие с его определением.
В системах классификации с детализацией свойств эти свойства ассоциируются с некоторыми или со всеми классами. Для обеспечения возможности наследования свойств такие системы классификации структурируются с помощью родовых отношений. Применение механизма наследования делает возможным существенное сокращение числа определений свойств благодаря общности свойств внутри древовидных подструктур иерархии.
Пример 2 - На рисунке 6 проиллюстрирован пример системы классификации без детализации характеристик.
- партитивное отношение
Рисунок 5 - Свойства в рамках систем классификации
- родовое отношение
Примечание - Этот рисунок служит только иллюстративным целям и не может претендовать на роль полноценной системы классификации вин.
Рисунок 6 - Пример системы классификации без детализации
характеристик
Пример 3 - На рисунке 7 показана система классификации, в которой свойство "Объемная доля алкоголя" передается вниз по иерархии подчиненным классам "Алкогольные напитки".
- родовое отношение;
- свойства
Рисунок 7 - Система классификации с характеристиками,
разрешенными для любого класса
Системы классификации, в которых использование свойств ограничивается листовым уровнем, не дают никакого выигрыша от сокращения числа свойств за счет применения механизмов наследования.
Пример 4 - На рисунке 8 отображена система классификации, в которой свойства присваиваются только финальным (листовым) элементам. Это значит, что свойство "Объемное содержание алкоголя" должно быть воспроизведено в классе "Спирты".
- родовое отношение;
- свойства
Рисунок 8 - Система классификации с характеристиками,
разрешенными только на уровне финальных классов
5.4.6 Отношения в системах классификации
Для целей проектирования систем классификации важную роль играют два типа отношений между классами:
- родовые отношения;
- партитивные отношения.
Родовые отношения образуют иерархии классов в результате последовательного формирования схемы соподчинения в направлении от самого общего класса к самому нижнему уровню с максимально детализированными классами. Этот процесс поддерживается механизмом наследования, в рамках которого подчиненные классы всегда наследуют отношения и правила от своего вышестоящего класса. Таким образом, подчиненные классы включаются в состав целевых объектов их непосредственного подчиняющего класса. Один подчиненный класс может принадлежать нескольким подчиняющим классам, и такие ситуации называются "полииерархией". Когда имеет место полииерархия, подчиняющие классы не должны иметь пересекающихся областей применимости, т.е. ни один класс не должен попадать одновременно в области обоих классов и таким образом становиться членом обоих. В противном случае возможно возникновение неопределенности в подчиненных классах в результате наследования противоречивой информации об элементах, которые неоднозначно определены в подчиняющих классах.
Пример 5 - Упрощенный пример полииерархии показан на рисунке 9, где класс "Электродвигатель" является деталью механического оборудования и одновременно - деталью электрического оборудования.
- родовое отношение;
- свойства
Рисунок 9 - Упрощенный пример полииерархии
Примечание - Иерархия классов может разрабатываться в направлении сверху вниз или снизу вверх. Последовательное соподчинение классов не требует строгой последовательности шагов при построении системы классификации.
Партитивные отношения выражают связи типа часть - целое, когда подчиненный класс является частью подчиняющего класса. Механизм наследования при таком типе отношений неприменим.
