稳健统计和Grubbs检验法在实验室间能力验证结果分析中的应用——以海洋生物体中总汞测定结果为例

2014-06-26 09:54宋金明
海洋科学 2014年2期
关键词:检验法生物体离群

李 军,宋金明

(中国科学院 海洋研究所, 山东 青岛 266071)

能力验证(Proficiency testing)是国际上通用的评价实验室检测/校准能力的手段和方法。开展能力验证,是验证实验室技术能力,督促获得资质认定的实验室不断提高技术水平的重要手段,可为评价实验室出具数据的可靠性和有效性提供客观依据,实验室也可以根据能力验证评价结果提高自身的质量体系管理水平。国家认证认可监督管理委员会也于 2006年颁布了《实验室能力验证实施办法》规范实验室能力验证活动和提高实验室能力验证活动的有效性。

能力验证是多个实验室针对特定具有“准标准”的样品,按照统一的标准规范方法进行测定,针对不同实验室的测定结果,以评定其测定结果的偏离程度,最终确定参加能力验证实验室的检测能力与水平。近年来,我国海洋科技界组织过几次行业内的能力验证,样品涉及海水、海洋生物体、海洋沉积物等,对规范海洋实验室的标准化运行、提高我国海洋监/检测实验室的技术水平、提升海洋监/检测人员业务水平和确保海洋监测/检测数据质量,发挥了重要的作用。本文对稳健统计技术(Robust statistical technique)和Grubbs检验法在实验室间能力验证中的应用,以海洋生物体中总汞测定结果为例进行了分析,以期推动拓展稳健统计技术在实验室间能力验证结果分析中的应用。

1 实验室间能力验证结果评定的统计分析方法

1.1 稳健统计技术(Robust statistical technique)

稳健统计技术(Robust statistical technique)是国际上广泛采用的实验室能力验证结果的数据统计和能力评价的方法,中国合格评定国家认可委员会也推荐使用此方法进行能力验证结果统计和评价[1-2]。稳健统计技术主要统计量有结果总数(N)、中位值(Median)、标准化四分位间距(NormIQR)、稳健变异系数(Robust CV)、最小值(Xmin)、最大值(Xmax)、变化范围(Range)等7个。

1)结果总数(N): 对一个特定样品按照统一的规范方法检测得到的结果的数量。

2)中位值(Median): 一组由小到大排列的 N个测量值的中间值,当N为奇数时,中位值为(N+1)/2个次序测量值;当N为偶数时,中位值为N/2与(N/2+1)两个次序测量值的算术平均值。

3)标准化四分位间距(NormIQR): 表示数据分散程度的一个统计量,类似于正态分布中的标准偏差,由上四分位值(Q3)和下四分位值(Q1)计算而得。下四分位值(Q1)为在一组顺序排列的测量值中,低于结果的四分之一处的最近值,即尽可能有1/4的测量值低于该值。上四分位值(Q3)为在一组顺序排列的测量值中,高于结果的3/4处的最近值,即尽可能有1/4的测量值高于该值。大多数情况下,Q1和Q3通过相邻两个数据值的内插获得。上四分位值Q3与下四分位值Q1的差值,即IQR = Q3-Q1叫做四分位间距(IQR)。由四分位间距IQR乘以因子0.7413即得标准化四分位间距(NormIQR),即 NormIQR =0.7413×IQR。

4)稳健变异系数(Robust CV): 等于标准化四分位间距(NormIQR)除以中位值(Median),并以百分数表示,即 Robust CV = 100%×NormIQR/ Median。

5)最小值(Xmin): 一组由小到大顺序排列的测量值中的最低值。

6)最大值(Xmax): 一组由小到大顺序排列的测量值中的最高值。

7)变化范围(Range): 最大值与最小值之差,即Range=Xmax-Xmin。

稳健统计技术用中位值(Median)和标准化四分位间距(NormIQR)代替经典统计方法中的平均值和标准偏差,克服了经典统计方法容易受离群值(极端值)影响的缺点,从而保证了统计方法的稳健性。

能力验证通常采用单一样品或样品对(样品均匀性需满足验证要求)进行,当使用单一样品作为能力验证样品时,通过各实验室提供的数据计算 Z比分数来评定一个实验室的检测能力。Z比分数按下式计算:

|Z|≤ 2 为满意结果;

2<|Z|<3 为有问题或可疑结果;

|Z|≥ 3 为不满意或离群结果。

当使用样品对作为能力验证样品(设定测量结果为A和B)时,首先计算结果对的标准化和(S)和标准化差(D)。

ZB和ZW反映的是实验室的系统误差和偶然误差,|ZB|≥3表明该实验室的 ZB值为不满意或离群结果,实验室的系统误差太大;|ZW|≥3表明该实验室的 ZW值为不满意或离群结果,实验室的偶然误差太大。

1.2 Grubbs检验法

经典的离群数据统计检验方法有多种,如Dixon检验法、Grubbs检验法、Cochran检验法等,《海洋监测规范》对上述方法都有介绍,并推荐使用这些方法判定离群数据,其中 Grubbs检验法应用比较广泛[3-4]。Grubbs检验法适用于检验一组测定值中最大值或最小值是否为离群值,此方法通过计算平均值和标准偏差SD,然后计算可疑值的统计量(T),通过查阅 Grubbs检验临界值(Tα)表,在一定的显著性水平(α)下与查到的临界值(Tα)比较,当统计量的计算值大于确定的显著性水平 α(海洋行业一般确定 α=0.01,相当于可信度为 99%)时的临界值,此可疑值即为离群值,剔除此离群值,并对剩余数据继续检验,直到数据中无异常值为止。

对同一验证样品检测得到的 N个测量结果,分别为X1,X2,…,XN,按由小到大顺序排列,最大值记为Xmax,最小值记为Xmin,对这N个测量结果按下式计算平均值和标准偏差SD:

可疑值为最大值时统计量T1按下式计算:

可疑值为最小值时统计量T2按下式计算:

使用Grubbs检验法评定离群值,有两种情形:

第一种情形,单侧情形,即离群值要么是最大值,要么是最小值,这需要根据经验或实际情况判定,在此种情形下,按式(6)或式(7)计算统计量 T1或T2,与显著性水平α= 0.01时的临界值(Tα)比较,如果T1>Tα,则评定最大值 Xmax为离群值;如果 T2>Tα,则评定最小值Xmin为离群值。

第二种情形,双侧情形,即离群值可能是最大值,也可能是最小值,按式(6)和式(7)分别计算统计量T1或T2,在此种情形下,需与确定的显著性水平α的一半的显著性水平(即α/2)时的临界值(Tα/2)比较,如果 T1>T2且 T1>Tα/2,则评定最大值 Xmax为离群值;如果 T2>T1且 T2>Tα/2,则评定最小值 Xmin为离群值。

2 稳健统计和Grubbs检验法评定海洋生物体中总汞测定结果能力验证中的离群值

海洋环境中的汞作为主要的重金属污染物,是海洋环境质量调查研究中的常规检测项目[5],由于汞的易挥发性,样品的处理对最终检测结果影响甚大,如操作不规范,将导致测定结果的不可信[6]。所以选择海洋生物体中总汞进行实验室间能力验证具有典型性和代表性。

2.1 稳健统计评定总汞测定结果中的离群值

我国海洋科技界近期组织了一次海洋行业通过实验室资质认定的海洋监/检测实验室能力验证活动,验证项目之一为海洋生物体中总汞(Hg)含量的测定。该验证采用单一样品作为能力验证样品,参加的实验室共60家,在规定的时间内,提供有效数据的51家,各实验室提供2个平行测定结果,取平均值进行统计处理。采用稳健统计技术处理后,根据式(1)计算Z比分数,结果见表1(未提供有效数据的9家实验室,代码为 4、28、41、44、49、51、53、57、58 未在表1中列出)。

依据表1中的数据,可得Z比分数绝对值范围状态分布图(图1)。结合表1和图1可以看出,有42个实验室提供的数据属满意结果(︱Z︱≤ 2),占82.4%,说明绝大多数实验室具有良好的检测能力;4个实验室提供的数据属有问题或可疑结果(2<|Z|<3),占7.8%;其余5个实验室的Z比分数绝对值大于3,占 9.8%,属不满意结果,说明这 5个实验室的测定值为离群值。其中,23、60、30实验室的离群值最大,其实验室测定结果不可信。

图1 海洋生物体中总汞含量测定能力验证Z比分数绝对值范围分布图Fig.1 Z-Score distribution of total mercury in marine organisms

2.2 Grubbs检验法评定总汞测定结果中的离群值

根据Grubbs检验法对本次能力验证活动生物体中总汞含量测定值(表 1)进行离群值检验,将表 1中的测定值按由小到大顺序排列,见表2。

按式(4)和式(5)计算平均值和标准偏差,式(6)和式(7)计算可疑值为最大值或最小值的统计量T1或T2,并查阅 Grubbs检验临界值(Tα)表,此处离群值可能是最大值,也可能是最小值,因此需查阅与确定的显著性水平 α=0.01的一半即 α/2=0.005(相当于可信度为99.5%)时的临界值Tα/2,依据1.2中给出的离群值评定准则,与计算出的统计量进行比较,发现离群值,剔除该离群值,对余下的数据继续检验,直到没有新的离群值为止。结果见表3。

结合表2中实验室的测定数据,由表3中可以看出,代码为23、60和30的实验室测定数据为离群值。与稳健统计技术相比,离群值评定结果一致。在 2.1结果中,代码为38和52的实验室(Z值分别为3.86和 3.08,处于离群结果的临界处)的测定值也评定为离群值,而用 Grubbs检验法评定,此两个实验室的数据评定为非离群值。

3 结 语

实验室能力验证样品测定结果的评定直接决定了验证结论,因此,样品测定结果评定的科学、公正至关重要。本文首先对目前常用的稳健统计技术(Robust statistical technique)和Grubbs检验法进行了介绍,而后,应用这两种方法对实验室间能力验证海洋生物体样品总汞含量检测结果进行了评定分析。结果表明,两种统计方法在海洋生物体样品总汞含量评定离群值结果基本一致。与Grubbs检验相比,稳健统计技术数据处理和计算程序更加科学、直观和简洁方便。但也应注意,使用稳健统计技术评价能力验证的结果时,对处于临界状态的离群值应更加审慎,避免出现统计学上的“弃真”风险。

表1 海洋生物体中总汞含量测定评价稳健统计结果Tab.1 Proficiency testing results of the total mercury in marine organisms analyzed by robust statistical techniques

表2 海洋生物体中总汞含量测定结果按顺序排列表Tab.2 Test results in sequential order for total mercury in marine organisms

表3 Grubbs检验评定海洋生物体样品能力验证中的离群值结果Tab.3 Results of outliers in proficiency testing for total mercury in marine organisms analyzed by Grubbs test method

[1]中国合格评定国家认可委员会.CNAS-GL02,能力验证结果的统计处理和能力评价指南[S].

[2]夏铮铮,刘卓慧.实验室认可与管理基础知识[M].北京: 中国计量出版社,2003: 86.

[3]中华人民共和国国家质量监督检验检疫总局,中国国家标准化管理委员会.数据的统计处理和解释,正态样本离群值的判断和处理[S].北京: 中国标准出版社,2008.

[4]中华人民共和国国家质量监督检验检疫总局,中国国家标准化管理委员会.GB17378.2-2007,海洋监测规范 第2部分: 数据处理与分析质量控制[S].北京:中国标准出版社,2007.

[5]Song Jinming.Biogeochemical Processes of Biogenic Elements in China Marginal Seas[M].Springer-Verlag GmbH &Zhejiang University Press,2010: 1-662.

[6]Duan Liqin,Song Jinming,Xu Yayan,et al.The distribution,enrichment and source of potential harmful elements in surface sediment sof Bohai Bay,North China[J].Journal of Hazardous Materials,2010,183: 155-164.

猜你喜欢
检验法生物体离群
一种基于邻域粒度熵的离群点检测算法
生物体的氧感受与适应
肝素在生物体内合成机制研究进展
一种相似度剪枝的离群点检测算法
PCR 检验法和细菌培养法用于阴道细菌检验的效果
混合χ2检测法在组合导航系统故障检测中的应用
论TRIPS协议中“三步检验法”存废之争和解决途径
离群数据挖掘在发现房产销售潜在客户中的应用
基于Moodle平台的高中生命科学课堂教学实践研究——《生物体内营养物质转变》教学案例
应用相似度测量的图离群点检测方法