ГОСТ Р ИСО/МЭК 19941-2021. Национальный стандарт Российской Федерации. Информационные технологии. Облачные вычисления. Интероперабельность и переносимость
8.3 Семантическая переносимость данных
8.3.1 Общие положения
Семантическая переносимость данных - это такая переносимость данных, при которой значение модели данных понятно целевой системе в пределах контекста предметной области. (Логическая) модель данных, иногда называемая метамоделью, выражает элементы данных, их имена и атрибуты, логические структуры, отношения и другие необходимые ограничения.
Семантика рассматривает понятия внутри предметной области, их свойства, терминологию и словарь, а также структурные отношения между ними. Семантика также касается правильности, достоверности и полноты данных. Примером правильности является определение того, является ли почтовый индекс действительным для предоставленного адреса. Примером полноты являются данные, в которых говорится, что в отделе работают 100 сотрудников, но предоставлены только 50 записей о сотрудниках.
В следующих подпунктах определяются модели данных в контексте облачных вычислений в зависимости от типа службы облачных вычислений.
8.3.2 Семантическая переносимость данных для служб облачных вычислений с типом возможностей инфраструктуры
Для служб облачных вычислений с типом возможностей инфраструктуры значимыми являются следующие аспекты данных: метаданные для вычислений, хранения и передачи по сети. Как правило, они необходимы для обеспечения возможности миграции виртуальных машин и рабочих данных.
Таким образом, артефакты данных относятся к образам виртуальных машин, файловым системам, хранилищам контента, базам данных и т.п. Для служб облачных вычислений с типом возможностей инфраструктуры характерно, что семантическое содержимое артефактов данных не имеет значение для службы, поскольку артефакты данных обрабатываются приложениями, принадлежащими потребителям службы облачных вычислений, а не самой службой облачных вычислений. Единственный случай, когда семантика артефактов имеет непосредственное отношение к службе облачных вычислений, относится к образам программ, предназначенным для исполнения в службе облачных вычислений с вычислительными возможностями, который рассматривается в подразделе 9.3 "Переносимость приложений".
8.3.3 Семантическая переносимость данных для служб облачных вычислений с типом возможностей платформы
Для служб облачных вычислений с типом возможностей платформы модели данных относятся к приложениям, предназначенным для установки. Это включает в себя артефакты, связанные с кодом приложения, либо с исходным кодом, либо скомпилированными исполняемыми файлами и метаданными для сборки артефактов для выполнения. Также присутствуют данные потребителей служб облачных вычислений в хранилищах данных, таких как базы данных или файловые системы и хранилища объектов.
В большинстве случаев семантика данных потребителей службы облачных вычислений не имеет непосредственного отношения к самой службе облачных вычислений, поскольку данные обычно обрабатываются кодом приложения, принадлежащим потребителю службы облачных вычислений. Однако службы облачных вычислений с типом возможностей платформы могут включать в себя наборы служб, и некоторые из этих служб могут использоваться приложениями потребителей служб облачных вычислений. В этом случае службы могут в конечном итоге обработать некоторые данные потребителей служб облачных вычислений, и, если это так, семантика данных потребителей служб облачных вычислений имеет большое значение. Необходимо, чтобы семантика данных соответствовала ожидаемой соответствующими службами, иначе возможны непредвиденные результаты. Вероятно, потребителям службы облачных вычислений будет необходимо учесть все различия между семантическими ожиданиями используемых служб и семантикой исходных данных потребителя службы облачных вычислений.
Для артефактов кода приложения семантические соображения рассматриваются в рамках облачной переносимости приложений для платформ в 9.4.
8.3.4 Семантическая переносимость данных для служб облачных вычислений с типом возможностей приложения
В случае служб облачных вычислений с типом возможностей приложения код приложения службы облачных вычислений оперирует непосредственно данными потребителя службы облачных вычислений. Согласно 8.2.4, понятия предметной области и модель данных диктует само приложение. Потребителю службы облачных вычислений необходимо полностью понимать семантику данных, используемых приложением службы и гарантировать, что данные потребителя службы облачных вычислений, предоставленные приложению, обладают необходимой семантикой. Для определения модели данных прикладной области изучаются понятия прикладной области, их свойства, терминология, словарь и структурные отношения между понятиями. В таблице 6 приведен неисчерпывающий список факторов, которые следует принимать во внимание при изучении и сравнении артефактов данных от необлачных приложений и/или служб облачных вычислений в целях переноса данных между ними.
Таблица 6
Пример соображений для приведения в соответствие
семантики приложений
Темы | Соображения |
Какие концепции предметной области охвачены приложением? | У облачной службы, предоставляющей сервисы электронной почты, существуют понятия адреса электронной почты, отправителя, получателя, предмета, тела и вложений, а также возможность группировать электронные письма в папки. У облачной службы размещения фотографий существуют понятия фотографий и фотонаборов или альбомов. У облачной службы учета человеческих ресурсов имеются отделы, сотрудники и сведения о том, кто перед кем отчитывается |
Если сравнивать два приложения, насколько их концепции предметной области аналогичны? | Ожидается, что у почтовых служб будут одинаковые понятия электронной почты и адреса электронной почты, однако некоторые службы не предлагают традиционный подход организации почты в виде иерархии папок. Следовательно, такая информация может потеряться, если между понятиями не установлены соответствия: например, папкам поставлены в соответствие ярлыки |
Если сравнивать два приложения, насколько эквивалентны значения словаря? | Действительно ли изображение идентично фотографии? Запись в медицинской службе облачных вычислений - это то же самое, что запись в музыкальной службе? |
Если сравнивать два приложения, насколько эквивалентны термины, использованные для эквивалентных концепций? Они - синонимы или являются терминами, используемыми для совсем других понятий? | Если две облачных службы размещения фотографий применяют термин "фотография", используется ли этот термин для представления одного и того же понятия? Например, включает ли он в себя метаданные, местоположение, установки чувствительности ИСО и т.д., или нет? Различные облачные службы размещения фотографий могут использовать различные термины для одного и того же понятия. Например, одна служба использует термин "фотография", в то время как другая - термин "изображение" |
Если сравнивать модели приложения, являются ли эквивалентными или отличаются отношения между понятиями? | Некоторая облачная служба управления человеческим капиталом использует концепцию пунктирной линии на диаграмме отношений между сотрудниками, чтобы выразить отношения, отличающиеся от отношения "руководитель - подчиненный"; в то же время другая аналогичная облачная служба может представлять только отношения "руководитель - подчиненный". Это может привести к потере информации при переносе данных между приложениями, которые отличаются подобным образом |
Если сравнивать модели приложения, являются ли эквивалентными классификации/типологии? | Концепции могут быть сгруппированы различным образом в зависимости от предметной области |
Если сравнивать модели приложения, являются ли эквивалентными ограничения и правила? | На объекты в модели данных могут налагаться ограничения, обусловленные ограничениями и правилами предметной области; ограничения могут различаться между службами облачных вычислений |
Понятия, терминология и отношения между понятиями совершенно необходимы для понимания модели предметной области и любых различий между приложениями, как необлачных, так и облачных служб. Если семантический перенос данных производится между приложениями, то требуется, чтобы приложения одинаково понимали модели предметной области. Документировать общее понимание можно посредством семантических языков, таких как OWL и Структуры описания ресурсов (Resource Description Framework, RDF), и нотаций моделирования, таких как UML и Язык управления бизнес-процессами (Business Process Management Language, BPML). Инструменты моделирования, поддерживающие такие нотации, как UML и BPML, как правило, определяют форматы обмена, которые могут использоваться на синтаксическом уровне переносимости данных. Помимо этого, различные специализированные области, например, науки о жизни, определили языки для выражения моделей предметной области <1>.
--------------------------------
<1> https://www.w3.org/wiki/SemanticWebForLifeSciences
Если семантические модели источника и цели переносимости данных различаются, то существует необходимость в выполнении какого-либо семантического отображения между исходными данными и целевыми данными. Этот процесс отображения может быть простым или очень сложным в зависимости от характера различий между семантическими моделями.