ГОСТ Р 50779.60-2017 (ИСО 13528:2015). Национальный стандарт Российской Федерации. Статистические методы. Применение при проверке квалификации посредством межлабораторных испытаний
7. Определение приписанного значения и его стандартной неопределенности
7.1 Выбор метода определения приписанного значения
7.1.1 В 7.3 - 7.7 приведены пять методов определения приписанного значения. За выбор метода отвечает провайдер проверки квалификации.
Примечание - Подразделы 7.3 - 7.6 аналогичны подходам, используемым для определения характеристик свойств сертифицированных стандартных образцов, описанных в ГОСТ ISO Guide 35.
7.1.2 Альтернативные методы определения приписанного значения и его неопределенности могут быть использованы при условии, что они имеют строгое статистическое обоснование, а используемый метод описан в документированном плане для программы проверки квалификации, и это описание полностью известно участникам. Независимо от метода, используемого для определения приписанного значения, всегда целесообразно проверить обоснованность выбора приписанного значения для конкретного раунда программы проверки квалификации. Более подробное обсуждение этого положения приведено в 7.8.
7.1.3 Подходы к определению приписанных значений для качественных данных рассмотрены в 11.3.
7.1.4 Метод определения приписанного значения и соответствующей ему неопределенности должен быть указан в каждом отчете для участников или четко описан в протоколе программы проверки квалификации, доступном всем участникам.
7.2 Определение неопределенности приписанного значения
7.2.1 В руководстве по выражению неопределенности измерения ГОСТ Р 54500.3 приведены рекомендации по оценке неопределенности. В ГОСТ ISO Guide 35 представлены рекомендации по определению неопределенности приписанного значения для аттестованных значений показателей свойств, которые могут быть использованы при разработке многих программ проверки квалификации.
7.2.2 Общая модель приписанного значения и его неопределенности описывается уравнениями (2) и (3).
Модель приписанного значения может быть рассчитана следующим образом:
, (2)
где xpt - приписанное значение;
xchap - показатель свойства, полученный при характеризации (определении приписанного значения);
- погрешность, вызванная различиями образцов для проверки квалификации;
- погрешность, вызванная нестабильностью условий транспортирования;
- погрешность, вызванная нестабильностью процесса проведения проверки квалификации.
Соответствующая модель неопределенности приписанного значения имеет вид:
, (3)
где u(xpt) - стандартная неопределенность приписанного значения;
uchar - стандартная неопределенность, соответствующая характеризации;
uhom - стандартная неопределенность, связанная с различиями между образцами;
utrans - стандартная неопределенность, соответствующая нестабильности условий транспортирования образцов;
ustab - стандартная неопределенность, соответствующая нестабильности процесса проведения проверки квалификации.
Примечание 1 - Ковариация источников неопределенности или даже незначительных источников неопределенности может привести к другой модели в конкретных случаях. В некоторых ситуациях все компоненты неопределенности могут быть равны нулю или ничтожно малы.
Примечание 2 - При расчете стандартного отклонения результатов участников составляющие неопределенности, обусловленные неоднородностью, условиями транспортирования и нестабильностью процесса проверки, в значительной степени отражаются в изменчивости результатов участников. В этом случае достаточно учитывать неопределенность характеризации в соответствии с 7.3 - 7.7.
Примечание 3 - Обычно предполагают, что провайдер проверки квалификации гарантирует, что изменения, связанные с нестабильностью процесса или условиями транспортирования образцов, пренебрежимо малы по сравнению со стандартным отклонением для оценки квалификации; то есть гарантируют, что и
пренебрежимо малы. Если это требование удовлетворено, ustab и utrans можно считать равными нулю.
7.2.3 Приписанное значение может иметь смещение, которое не учтено в выражении (2). Это следует по возможности учитывать при разработке программы проверки квалификации. Если проведена корректировка смещения приписанного значения, то неопределенность, соответствующая такой корректировке, должна быть включена в оценку неопределенности приписанного значения.
7.3 Состав образцов
7.3.1 Образец для проверки квалификации может быть подготовлен путем смешивания материалов с различными известными уровнями содержания вещества в установленных пропорциях или добавления установленного количества вещества к основному материалу.
7.3.1.1 Приписанное значение xpt получают путем расчета на основе содержания веществ в используемых материалах. Такой подход особенно важен, когда отдельные образцы для проверки квалификации подготовлены описанным способом и пропорции используемых материалов известны.
7.3.1.2 Следует предпринять необходимые действия для того, чтобы обеспечить следующее:
a) основной материал должен быть практически свободен от дополнительных компонентов, или их доли должны быть точно известны;
b) компоненты должны быть смешаны до однородности (если это необходимо);
c) все существенные источники ошибок должны быть идентифицированы (например, не всем известно, что стекло поглощает соединения ртути, так что концентрация соединения ртути в водном растворе может измениться, если раствор находится в стеклянном контейнере);
d) не существует неблагоприятного взаимодействия между компонентами и основным веществом;
e) свойства образцов для квалификационных испытаний, содержащих дополнительный материал, должны быть аналогичны свойствам образцов, обычно используемых заказчиком. Например, чистые материалы, добавляемые к природной основе, часто извлечь легче из такой же субстанции природного происхождения. Если существует возможность возникновения такой ситуации, провайдер должен обеспечить пригодность образцов для используемых методов проверки квалификации.
7.3.1.3 Если в образцах для проверки квалификации добавки более слабо связаны, чем в обычно проверяемых образцах, или находятся в другой форме, предпочтительнее использовать другой подход для подготовки образцов.
7.3.1.4 Определение приписанного значения по составу материала образцов является одним из случаев общего подхода к характеризации сертифицированных стандартных образцов, описанного в ISO Guide 35, когда единственная лаборатория определяет приписанное значение с использованием основного метода измерения. Существуют и другие способы определения приписанного значения единственной лабораторией с помощью основного метода (см. 7.5)
7.3.2 Если приписанное значение рассчитывают на основе состава материала образцов для проверки квалификации, оценки стандартной неопределенности uchar определяют с помощью сочетания неопределенностей, используемых в соответствующей модели. Например, при проверке квалификации лабораторий, выполняющих химические измерения, основными являются неопределенности, связанные с гравиметрическими измерениями, измерениями объема и чистотой всех материалов, используемых при составлении образца. Стандартную неопределенность приписанного значения u(xpt) рассчитывают по уравнению (3).
7.4 Сертифицированный стандартный образец
7.4.1 Если образец для проверки квалификации является сертифицированным стандартным образцом CRM, его сертифицированное значение xCRM используется в качестве приписанного значения xpt.
Ограничения такого подхода вызваны следующим:
- обеспечить каждого участника сертифицированным стандартным образцом потребует больших средств;
- обеспечить долговременную стабильность образца часто очень сложно, что может приводить к нецелесообразности замены образца;
- сертифицированные стандартные образцы могут быть известны участникам, и поэтому важно скрыть их истинные характеристики.
7.4.2 При использовании CRM в качестве образца для проверки квалификации стандартную неопределенность приписанного значения выводят из информации о неопределенности, указанной в сертификате. Сертификат должен включать в себя информацию о компонентах из уравнения (3) и информацию о предполагаемом использовании образца для целей программы проверки квалификации.
7.5 Результаты одной лаборатории
7.5.1 Приписанное значение может быть определено единственной лабораторией с использованием эталонного метода, например, основного метода. Используемый эталонный метод должен быть полностью описан и понятен с утверждением полной неопределенности и документированной метрологической прослеживаемостью, подходящей для целей программы проверки квалификации. Эталонный метод должен быть совместим со всеми методами измерений, используемыми участниками.
7.5.1.1 Приписанное значение рассчитывают как среднее арифметическое, определяемое для двух или большего количества образцов или условий измерений и при достаточном количестве репликаций измерений.
7.5.1.2 Неопределенность характеризации представляет собой соответствующую оценку неопределенности для эталонного метода и условий исследования в соответствии с планом эксперимента.
7.5.2 Приписанное значение xpt образца для проверки квалификации может быть получено с помощью единственной лаборатории и посредством использования подходящего метода измерений по данным калибровки на соответствие опорному значению, соответствующему сертифицированному стандартному образцу.
Такой подход предполагает, что CRM совместим со всеми методами измерений, используемыми участниками.
7.5.2.1 Это определение требует проведения серии испытаний, проводимых в одной лаборатории, на образцах для проверки квалификации и CRM с использованием одного и того же метода и в условиях повторяемости.
Если xCRM - приписанное значение для CRM;
xpt - приписанное значение образца для проверки квалификации;
di - разность между средним арифметическим результатов для образца проверки квалификации и CRM для i-го образца;
- среднее арифметическое разностей di, тогда
. (4)
Примечание - xCRM и независимы, за исключением того редкого случая, когда CRM получен экспертной лабораторией.
7.5.2.2 Стандартную неопределенность характеризации выводят на основе неопределенности измерений, используемых для определения приписанного значения. Такой подход позволяет установить приписанное значение таким образом, чтобы была обеспечена метрологическая прослеживаемость с сертифицированным значением CRM и стандартной неопределенностью, полученной в соответствии с уравнением (5):
. (5)
Пример, приведенный в E.5 приложения E, показывает, как требуемая неопределенность может быть вычислена в простом случае, когда приписанное значение образца для проверки квалификации устанавливают прямым сопоставлением с единственным CRM.
7.5.3 Если опорное значение присваивают до начала раунда последовательной программы проверки квалификации, а затем опорное значение проверяют, используя ту же измерительную систему, то разность полученных значений должна быть меньше, чем удвоенная неопределенность этой разности (то есть результаты должны быть метрологически совместимыми). В таких случаях провайдер проверки квалификации может принять решение об использовании в качестве приписанного значения среднего арифметического результатов измерений с соответствующей неопределенностью. Если результаты не являются метрологически совместимыми, провайдер должен исследовать причину различий и принять соответствующие меры, включая использование альтернативных методов определения приписанного значения и его неопределенности или прекращения раунда.
7.6 Согласованное значение по данным экспертных лабораторий
7.6.1 Приписанное значение может быть определено с применением межлабораторных сравнительных испытаний с привлечением экспертных лабораторий в соответствии с ISO Guide 35 для использования межлабораторного сравнения для характеризации CRM. Сначала подготавливают образцы для проверки квалификации и распределяют их между участниками. Некоторые из этих образцов отбирают случайным образом, и затем их анализирует группа экспертов с использованием протокола, в котором устанавливают количество образцов и репликаций и все другие соответствующие условия. Каждая эталонная лаборатория должна обеспечить стандартную неопределенность своих результатов.
7.6.2 Если экспертные лаборатории сообщают единственный результат и в соответствии с протоколом не требуется обеспечить достаточную информацию о неопределенности результатов или при наличии свидетельств либо предположении о недостаточной достоверности полученной неопределенности, согласованная величина должна быть получена в соответствии с методами, приведенными в 7.7, применяемыми к набору результатов экспертных лабораторий. Если каждая из экспертных лабораторий получает более одного результата (например, включая репликации), провайдер в программе проверки квалификации должен установить альтернативный метод определения приписанного значения, его неопределенности, и допускать наличие выбросов или других отклонений от ожидаемого распределения результатов, который должен быть статистически обоснованным.
7.6.3 Если экспертные лаборатории вместе с результатами измерений указывают их неопределенности, оценка приписанного значения путем согласования результатов является сложной проблемой, и для ее решения существует много подходов, включая, например, применение взвешенного среднего арифметического, невзвешенного среднего арифметического, процедур, допускающих большой разброс данных, и процедур, допускающих наличие выбросов или ошибочных результатов и оценок неопределенности [4]. Провайдер проверки квалификации должен соответствующим образом установить процедуру оценки, которая должна:
a) включать проверку достоверности указанных оценок неопределенности, например, проверку соответствия в полной мере указанной неопределенности наблюдаемому разбросу результатов;
b) использовать взвешенные процедуры с весами, соответствующими степени достоверности и размеру указанной неопределенности, например, равные веса в случае близких неопределенностей, либо низкой или неизвестной достоверности (см. 7.6.2);
c) допускать возможность того, что указанные неопределенности могут не в полной мере соответствовать наблюдаемому (полному) разбросу, например, путем включения дополнительного члена;
d) допускать возможность появления неожиданных удаленных значений в указанных результатах или неопределенностях;
e) иметь обоснованную теоретическую основу;
f) иметь продемонстрированные свойства (например, на данных испытаний или на моделях), необходимые для целей программы проверки квалификации.
7.7 Приписанное значение на основе согласованного значения результатов участников
7.7.1 При таком подходе приписанным значением xpt для образца, используемого в раунде программы проверки квалификации, является оценка параметра положения (например, робастное среднее, медиана или среднее арифметическое), сформированная на основе результатов, представленных участниками раунда, и рассчитанная с использованием процедуры в соответствии с планом эксперимента, приведенным в приложении C. Методы, описанные в 6.2 - 6.6, следует использовать до объединения результатов для обеспечения достаточной согласованности результатов.
7.7.1.1 В некоторых случаях провайдер проверки квалификации использует только группу участников, которые определены как надежные по некоторым критериям, например, на основе статуса аккредитации или предварительной работы. Методы настоящего подраздела применимы к таким ситуациям, в том числе и к определению размера группы.
7.7.1.2 Вместо методов, приведенных в приложении C, могут быть использованы и другие методы при условии, что они имеют статистическое обоснование и указаны в отчете.
7.7.1.3 Преимущества такого подхода заключаются в том:
a) что для получения приписанного значения никаких дополнительных измерений не требуется;
b) подход может быть особенно полезен для стандартизованной, оперативно определяемой измеряемой величины, так как часто нет более надежного способа получения равноценных результатов.
7.7.1.4 Недостатками данного подхода являются следующие:
a) между участниками могут отсутствовать необходимые соглашения;
b) согласованное значение может включать неизвестное смещение, вызванное общим использованием ошибочного метода, и это смещение не будет учтено в стандартной неопределенности приписанного значения;
c) согласованное значение может иметь смещение вследствие применения методов, дающих смещение при определении приписанного значения;
d) трудно определить метрологическую прослеживаемость согласованного значения. Поскольку результат всегда связан с результатами отдельных лабораторий, четкое установление прослеживаемости за их пределами может быть обеспечено только тогда, когда провайдер проверки квалификации имеет полную информацию об используемых калибровочных стандартах и контролирует условия других соответствующих методов, применяемых всеми участниками, участвующими в определении согласованного значения.
7.7.2 Стандартная неопределенность приписанного значения зависит от используемой процедуры. Если требуется самый общий подход, провайдер проверки квалификации должен рассмотреть вопрос об использовании бутстреп-метода для оценки стандартной погрешности приписанного значения. Подробное описание бутстреп-метода приведено в [5], [6].
Примечание - Пример использования бутстреп-метода приведен в E.6 приложения E.
7.7.3 Если приписанное значение определяют на основе робастного среднего, вычисляемого с использованием процедур, приведенных в C.2, C.3 или C.5 приложения C, оценку стандартной неопределенности приписанного значения и (xpt) можно определить по формуле
, (6)
где s* - робастное стандартное отклонение результатов. (Здесь "результатом" является среднее арифметическое всех результатов измерений, выделенных на образце для проверки квалификации.)
Примечание 1 - В данной модели, когда приписанное значение и робастное стандартное отклонение определяют по результатам участников, предполагается, что неопределенность приписанного значения включает влияние неопределенностей, соответствующих неоднородности, условиям транспортирования и нестабильности.
Примечание 2 - Значение коэффициента 1,25 выбрано на основе стандартного отклонения медианы или эффективности медианы как оценки среднего в большом наборе результатов, описываемых нормальным распределением. Следует понимать, что эффективность более сложных робастных методов может быть намного больше, чем методов, использующих медиану с поправочным коэффициентом менее 1,25. Тем не менее рекомендуется применять этот коэффициент, поскольку результаты проверки квалификации, как правило, не подчиняются строго нормальному распределению и содержат неизвестные доли результатов из различных распределений ("загрязненные результаты"). Коэффициент 1,25 обеспечивает получение гарантированной (завышенной) оценки с учетом возможного загрязнения. Провайдер проверки квалификации может обосновать использование меньшего значения коэффициента или другого уравнения в зависимости от опыта и используемой робастной процедуры.
Примечание 3 - Пример получения робастного среднего по результатам участников приведен в E.3 приложения E.
7.8 Сопоставление приписанного значения с независимым опорным значением
7.8.1 Если для установления приписанного значения используют методы, приведенные в 7.7, при наличии независимой оценки xref, например, из сведений о подготовке образцов или об опорном значении, согласованное значение следует сопоставлять с xref.
Если для установления приписанного значения используют методы, приведенные в 7.3 - 7.6, робастное среднее арифметическое x*, полученное по результатам раунда, следует сопоставлять с приписанным значением после каждого раунда программы проверки квалификации.
Стандартную неопределенность разности xdiff = (xref - xpt) или xdiff = (x* - xpt) определяют в следующем виде:
, (7)
где u(xref) - неопределенность опорного значения для сопоставления;
u(xpt) - неопределенность приписанного значения.
Примечание - Пример сопоставления опорного значения с согласованным значением включен в E.7 приложения E.
7.8.2 Если разность больше удвоенной соответствующей ей неопределенности, следует исследовать возможные причины этого явления. Возможными причинами могут быть:
- наличие смещения соответствующего метода измерений;
- общего смещения результатов участников;
- ошибки в понимании ограничений метода измерений при использовании метода, приведенного в 7.3;
- смещения в результатах экспертных лабораторий при использовании подходов, приведенных в 7.5 или 7.6;
- опорное значение и приписанное значение не связаны с одним и тем же метрологическим эталоном.
7.8.3 В зависимости от выявленной причины провайдер проверки квалификации должен решить, следует ли оценивать результаты раунда или нет, а также (для непрерывных программ проверки квалификации) нужно ли изменить план эксперимента для последующих программ проверки квалификации. Если разность достаточно велика и может повлиять на оценку функционирования лаборатории или можно предположить наличие существенного смещения у методов измерений, используемых участниками, разность следует указать в отчете. В таких случаях эту разность следует учитывать при разработке будущих программ проверки квалификации.
