环境监测比武—土壤pH值测定操作竞赛的设计与实践
(老兵)
今年,国家六部委联合组织了第二届全国生态环境监测专业技术人员大比武活动,为选拔出优秀专业技术人员参加国家比赛,各省(自治区、市)也联合相关个厅局开展了生态环境监测专业技术人员的大比武活动,现将所组织全省土壤pH值测定操作竞赛的方案设计与实践分享如下。
1 竞赛内容
要求采用土壤 pH 值的测定 电位法(HJ 962-2018)在90分钟内完成统一分发样品的测试并报出结果。竞赛的重点是测试结果的准确度、精密度、操作技能的规范性、熟练程度(完成时间)、原始记录的完整性和规范性等,报出结果以参赛者报出的“测试原始记录表”为准,完成时间以交表时间为准。
2 样品方案
目前现有市售GBW(ASA)系列有证土壤标准物质或土壤标准样品并非是采用规定的HJ962-2018竞赛方法定值的,如GBW07412~GBW07417、ASA和NSA系列标物是采用LY/T 1239-1999森林土壤pH值的测定(原GB7859-87)、《土壤分析技术规范》和土壤农业化学常规分析方法等方法定值,定值单位分别是中国地质科学院地球物理地球化学勘查研究所(简称:廊坊物化探所)、中国科学院南京土壤研究所、中国生态系统研究网络土壤分析中心、中国科学院成都山地灾害与环境研究所、中国科学院西北水土保持研究所、中国科学院沈阳应用生态研究所、中国林业科学研究院林业研究所、浙江省农业科学研究院、南京农业大学、农业部全国农业技术推广服务中心及相关省市的农业科学研究院、土壤技术中心和土肥测试中心等。这些检测机构的定值方法与HJ962-2018存在明显差异,详见表1我国土壤pH值测定方法及差异。如果样品不是近期生产定值的或密封性不好,其标准值将会变化,再加上规定方法与定值方法的差异,将导致测试结果难以再现,因此采用目前市售的有证土壤标准物质或土壤标准样品作为竞赛用样可能存在系统误差风险。对于近期市售的生态环境部质量控制样和廊坊物化探所的土壤酸碱度参比标准物质(详见图1)来说,前者不确定度太大,准确度判定过于宽松,且浓度太少;后者则不确定度太小,且定值方法是NY/T 1121.2-2006和LY/T 1239-1999,用HJ962法测定,不易做在不确定度范围内,尤其是碱性土相对酸性土来说对,对分配到测碱性土的选手来说有失公平。综合考虑决定采用自制样品实施考核,即用各地采集的多个土样,风干过2mm筛经充分混匀后分装编号,每轮竞赛采用同一浓度样品,各轮竞赛采用不同浓度的土样,样品均为酸性土。
3 评分办法
盲样操作竞赛满分为100分,评判按每个操作环节和要求进行,每项满分不得超过该项分值,判分采取逐点对照扣分的办法,每点扣完为止。每轮现场考核结束后由由各评判组在现场完成操作规范性的打分,然后交后台由评判专家统一完成其它项的打分。
3.1准确度(50分)
采用能力验证四位分数稳健统计法对各参赛选手的报告结果进行评价。其统计参数包括:每轮参赛选手数(N)、中位值(M)、标准四分位间距(IQR)、稳健变异系数(CV)、最小值(MIN)、最大值(MAX)、变动范围(R)和稳健Z比分数。其中中位值是一组数据的中间值;标准IQR是一个结果变异性的量度,它等于四分位间距乘以0.7413,相当于一个标准偏差;四分位间距是低四分位数值和高四分位数值的差值,低四分位数值(Q1)是指有四分之一的结果低于该值,而高四分位数值(Q3)是指有四分之一的结果高于该值,因此,IQR=Q3-Q1,标准IQR=IQR×0.7413;稳健CV是表示结果变异性的一个参数,它可以比较不同样品/测试中的变动性,它等于标准IQR除以中位值,用百分数表示,即稳健CV=标准IQR×100/M;稳健Z比分数是评价测试能力状况的参数,计算公式如下:
参赛选手的准确度得分参考CNAS GL02:2014《能力验证结果的统计处理和能力评价指南》以Z比分数量化评价,即:当〡Z比分数〡≤1Z得50分;当〡Z比分数〡>1Z且≤3Z时按“50-(Z比分数-1)╳20”计算得分(如2Z时可得30分相当于准确度为及格分);当〡Z比分数〡>3Z为不满意结果(离群值)得0分。
3.2精密度(10分)
精密度按盲样平行测定上报差值分档计分,差值小于0.1个pH单位得10分;差值>0.1且≤0.2个pH单位得6分,差值>0.2且≤0.3个pH单位得2分,差值>0.3或未上报或计算错误得0分。
3.3操作规范性及熟练程度(30分)
操作过程分别按样品称量、试样的制备、标液校准和定位、样品测定、量器标识和瓶签、器皿洁净程度、操作姿势、着装和内务等再逐点分解量化打分,满分为20分;操作熟练程度以完成时间的长短分五档计分,用时≤70分钟得10分,每五分钟一档,>90分钟得0分。
3.4记录和报告(10分)
原始记录和报告结果的规范性或完整性分解为是否使用受控原始记录表格,所用原始记录格式要求是否完整规范;测试记录是否实时、记录信息是否完整规范、是否存在誊抄和更改不规范;数据处理正确、有效数字和计量单位是否正确,结果报告是否规范等。
4 竞赛过程
生态环境监测综合比武设28个实验台,每个实验台由三名选手分别开展土壤pH、水中高锰酸盐指数和六价铬的测试,经两天7轮的现场操作比赛,49名现场评判专家全程进行了现场评判,有24支代表队162人完成了土壤pH操作竞赛。图2和图3为竞赛现场,图4~图7为部分参赛队所用的酸度计。
5 竞赛结果
全部参赛选手均在规定时间内报出了测试结果。统计结果显示,≤1Z准确度得满分的选手有112名,占69.1%;〡Z比分数〡>1Z且≤2Z的选手有20名,占12.4%;〡Z比分数〡>2Z且≤3Z的选手有13名,占8.0%;〡Z比分数〡>3Z准确度得0分的选手有17名,占%10.5;7个轮次的土壤pH操作竞赛结果统计评分详见表1和表2。参考能力验证规定检测结果满意率为81.5%,有问题8.0%,不满意为10.5%。总体而言,参加能力验证活动的实验室只要经过认真准备,其检测能力是可靠的。
6 结果不满意和有问题等原因分析
(1)仪器失准、电极有问题和存在线性误差,如编号为5、39、、49、75、79、83、139、143、159和157等选手所用的仪器。
(2)盲样测试用水可能有问题,有选手反映其所用煮沸除二氧化碳后的纯水pH为8~9,用这样的水来配制标准缓冲溶液和处理考核样会产生系统误差,而采用屈臣氏蒸馏水煮沸除二氧化碳后的实验用水测试效果则较好。
(3)少数选手在读数上有主观因素,存在对数嫌疑,比如同属一参赛队的19和75号选手,在不同轮次报告的结果分别是4.01和4.00,而每轮竞赛用样其实是不同的,其所考盲样的中位值分别是4.19和5.16。有的选手在盲样测试读数的平衡时间上参考已知样测试达标准值的时间是不妥的,因为每个土壤样品pH测试的平衡时间可能因土壤类型、样品粒径、测试方法、pH含量水平和样品状态的有效性等方面而存在差异。
(4)对仪器做最终校准定位时所用标准缓冲溶液的pH与测试盲样的pH值相差超过2个pH单位,比如156号选手最后用9.18的标准缓冲溶液来对仪器校准定位,分别测得的平行盲样结果为5.61和5.30,不仅其报告的平均值有问题(Z比分数为2.505),而且精密度也不得分。还有的在选手在测量pH>7.5以上的已知质控样品后,未用0.1mol的HCl活化一下后再测其它试样。
(5)较多的选手在精密度上得零分,主要原因是未按pH的测试规定上报平行测定结果的差值,不少选手错误习惯地按绝对偏差和相对偏差来报告精密度,还有少数选手报告的是单样重复读数或就没有做平行双样。
(6)在测试原始记录的格式完整性方面存在无称样记录、静置时间等设计缺陷,在原始记录设计的规范性方面存在标准缓冲溶液的测定顺序、平行样测试和精密度检查等格式上的缺陷;在操作过程的测试记录中存在未实时记录、漏记和誊抄等现象。
7 结论
“环境监测比武—土壤pH值测定的操作竞赛”对弘扬生态环境监测领域工匠精神,提高各级各类生态环境监测机构和人员技术水平,推动生态环境监测工作科学化、标准化和规范化具有重要意义。本次活动采用多个浓度的酸性土自制样品作为竞赛用样是科学、合理、公平的,采用稳健Z比分数能客观、公正地量化评价参赛选手盲样测试结果的准确度成绩,24支代表队162人采用能力验证方式的统计结果表明,盲样测试结果的满意率为81.5%,有问题8.0%,不满意为10.5%。
参考文献:
中国合格评定国家认可委员会. 能力验证结果的统计处理和能力评价指南. CNAS-GL02:2014.
GB/T15483.1-1999利用实验室间比对的能力验证 第一部分:能力验证计划的建立和运作.