ГОСТ Р 70889-2023 (ИСО/МЭК 8183:2023). Национальный стандарт Российской Федерации. Информационные технологии. Искусственный интеллект. Структура жизненного цикла данных
5 Обзор жизненного цикла данных
Жизненный цикл данных для систем искусственного интеллекта включает в себя процессы работы с данными от первоначального замысла создания новой системы ИИ до окончательного вывода этой системы из эксплуатации и разделен на несколько отдельных стадий. Каждая из этих стадий - часто, но не всегда - будет частью жизненного цикла данных в системе ИИ.
Жизненный цикл данных представляет собой все стадии, через которые данные могут проходить в системе ИИ, оперирующей данными произвольного типа. Он предназначен для поддержки достижения целей, связанных с управлением системой, полезностью системы, качеством данных и безопасностью данных, путем обеспечения того, чтобы обработке данных уделялось должное внимание при планировании, разработке, использовании и выводе системы из эксплуатации.
Детальное предназначение и последовательность прохождения этих стадий на протяжении жизненного цикла зависят от множества факторов, включая социальные, коммерческие, организационные и технические соображения, каждый из которых может меняться или иногда сочетаться с другими стадиями в течение жизненного цикла системы ИИ. Настоящий стандарт описывает следующие 10 стадий:
- стадия 1 - замысел;
- стадия 2 - формирование деловых требований;
- стадия 3 - планирование работы с данными;
- стадия 4 - комплектование наборов данных;
- стадия 5 - подготовка наборов данных;
- стадия 6 - построение модели ИИ;
- стадия 7 - развертывание системы ИИ;
- стадия 8 - эксплуатация системы ИИ;
- стадия 9 - вывод данных из эксплуатации;
- стадия 10 - вывод системы ИИ из эксплуатации.
Сведения о жизненном цикле данных при их использовании приведены в [2].