БИБЛИОТЕКА НОРМАТИВНЫХ ДОКУМЕНТОВ

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения

8.2 Функциональные возможности (functionality) СИИ. Метрики

 

8.2.1 Для оценки функциональных возможностей СИИ рекомендуется применять следующий набор субхарактеристик: функциональная пригодность (functional appropriateness), функциональная корректность (правильность) (functional correctness), согласованность (compliance), функциональная полнота (functional completeness), способность к самообучению (ability to learn).

8.2.2 Метрики функциональной полноты (functional completeness) используются для оценки степени покрытия совокупностью функций СИИ всех определенных задач и целей пользователя в условиях отсутствия предвзятости (необъективности) СИИ (см. таблицу 4).

 

Таблица 4

 

Примеры метрик оценки функциональной полноты

 

Наименование метрики

Формула

Измеряемый диапазон

Полнота реализации функций

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения, (9)

 

где A - количество недостающих или неправильно реализованных функций, обнаруженных при оценивании;

B - количество функций, описанных в технической и эксплуатационной документации

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения

 

8.2.3 Метрики функциональной корректности (правильности) (functional correctness) используются для оценки обеспечения СИИ степени точности результатов, а также частоты встречаемости ошибок и недопустимых отклонений (см. таблицу 5).

 

Таблица 5

 

Примеры метрик оценки функциональной корректности

 

Наименование метрики

Формула

Измеряемый диапазон

Результативность

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения, (10)

 

где A - количество результатов с отличным от требуемого уровнем точности;

B - общее количество результатов

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения

В задачах регрессии

Средняя квадратичная ошибка

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения, (11)

 

где y - выходные данные СИИ;

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения - эталонные (референсные) выходные данные;

N - количество результатов работы СИИ

MSE >= 0

Средняя абсолютная ошибка

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения, (12)

 

где y - выходные данные СИИ;

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения - эталонные (референсные) выходные данные;

N - количество результатов работы СИИ

MAE >= 0

В задачах классификации и обнаружения

Доля правильных исходов (accuracy)

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения, (13)

 

где TP - количество истинно положительных исходов;

TN - количество истинно отрицательных исходов;

FP - количество ложно положительных исходов;

FN - количество ложно отрицательных исходов

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения

Точность (precision, relevance)

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения, (14)

 

где TP - количество истинно положительных исходов;

FP - количество ложно положительных исходов

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения

Чувствительность, полнота (sensitivity, recall)

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения, (15)

 

где TP - количество истинно положительных исходов;

FN - количество ложно отрицательных исходов

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения

Избирательность (specificity)

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения, (16)

 

где TN - количество истинно отрицательных исходов;

FP - количество ложно положительных исходов

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения

F-мера

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения, (17)

 

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения,

 

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения,

 

где TP - количество истинно положительных исходов;

FP - количество ложно положительных исходов;

FN - количество ложно отрицательных исходов

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения

Площадь под кривой ROC

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения,

 

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения, (18)

 

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения,

 

где ROC-кривая - график зависимости чувствительности от избирательности;

Se - чувствительность;

Sp - избирательность;

TP - количество истинно положительных исходов;

TN - количество истинно отрицательных исходов;

FP - количество ложно положительных исходов;

FN - количество ложно отрицательных исходов

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения

Площадь под кривой PRC

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения,

 

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения, (19)

 

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения,

 

где PRC-кривая - график зависимости точности от чувствительности (полноты);

Pr - точность;

Se - чувствительность (полнота);

TP - количество истинно положительных исходов;

FP - количество ложно положительных исходов;

FN - количество ложно отрицательных исходов

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения

В задачах ранжирования

Приведенная суммарная эффективность

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения,

 

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения, (20)

 

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения,

 

где N - количество ранжированных элементов;

reli - оценка релевантности i-го элемента в ранжированном списке;

RELN - список релевантных элементов, упорядоченных по степени релевантности

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения

В задачах восстановления (синтеза и реконструкции) изображений

Пиковое отношение сигнал/шум

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения,

 

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения, (21)

 

Emax = 2B - 1,

 

где B - разрядность (глубина квантования);

Emax - максимальное значение яркости (интенсивности сигнала);

I - выходные данные СИИ;

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения - эталонные (референсные) выходные данные;

K - количество каналов (например, для монохромных изображений K = 1, в модели RGB K = 3)

-

Индекс структурного сходства

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения,

 

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения, (22)

 

где I - выходные данные СИИ;

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения - эталонные (референсные) выходные данные;

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения, ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения, ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения - весовые коэффициенты для каждого показателя, по умолчанию принимаются равными 1;

C1, C2, C3 - константы, которые следует вводить для предотвращения деления на ноль;

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения и ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения - среднее и среднеквадратическое отклонение выходных данных СИИ соответственно;

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения и ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения - среднее и среднеквадратическое отклонение эталонных выходных данных соответственно

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения

 

8.2.4 Метрики функциональной пригодности (functional appropriateness) используются для оценки степени функционального упрощения выполнения определенных задач и достижения целей. Например, для решения задачи пользователю предоставляется возможность выполнять только необходимые шаги, исключая любые ненужные (см. таблицу 6).

 

Таблица 6

 

Примеры метрик оценки функциональной целесообразности

 

Наименование метрики

Формула

Измеряемый диапазон

Степень автоматизации

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения, (23)

 

где A - количество шагов, выполняемых СИИ без привлечения пользователя, при реализации конкретной процедуры;

B - общее количество шагов при выполнении заданной процедуры

ГОСТ Р 59898-2021. Национальный стандарт Российской Федерации. Оценка качества систем искусственного интеллекта. Общие положения

 

8.2.5 Метрики способности к самообучению (ability to learn) используются для оценки уровня владения СИИ умением автоматически извлекать знания из накопленного опыта и применять их для улучшения качества решения поставленных задач.

TOC