仪器信息网APP
选仪器、听讲座、看资讯

【第一届网络原创作品】数据处理中的七宗罪

数据处理

  • 关于傲慢 (Pride),嫉妒(Envy),暴怒(Wrath),懒惰(Sloth),贪婪(Greed),饕餮(Gluttony),以及欲望(Lust)


    七宗罪(Se7en)是大卫•芬奇在1995年拍摄的一部犯罪电影,曾获得奥斯卡和英国电影学院奖提名。「暴食」、「贪婪」、「懒惰」、「嫉妒」、「骄傲」、[淫欲]、「愤怒」,这是天主教教义所指的人性七宗罪。城市中发生的连坏杀人案,死者恰好都是犯有这些教义的人。凶手故弄玄虚的作案手法,令资深冷静的警员沙摩塞(摩根•弗里曼 Morgan Freeman 饰)和血气方刚的新扎警员米尔斯(布拉德•皮特 Brad Pitt 饰)都陷入了破案的谜团中。

    想起来了吗?还算青涩的皮特和刚经过肖申克救赎的弗里曼。

    以下解释来自维基:七宗罪,正式译名为七罪宗,属于人类恶行的分类,并由13世纪道明会神父圣多玛斯•阿奎纳列举出各种恶行的表现。天主教教义中提出‘按若望格西安和教宗额我略一世的见解,分辨出教徒常遇到的重大恶行’。但是‘重大恶行’与不可饶恕的大罪是不可混而一谈。
    在此,我们不讨论宗教,人性或是为电影叫好,而是来说说数据处理。虽然面对数据处理,我只是个新手。对日常分析工作的了解很有限,但透过论坛也多多少少有了些认识。因此斗胆归纳出了数据处理中的七宗罪。这些行为或许并不算重大,更谈不上不可饶恕的大罪。有些是习惯,是默契,有些是我们暂时还不能改变的现实。如同台词说:“我们到处都能看到罪恶,在街头,在每个家里,我们容忍,因为见怪不怪,没什么大不了,我们总是从早容忍到晚。”

    按照电影的顺序,来看看这七宗罪吧,那些不好的习惯我们有则改之,无则加勉。目的都是为了更好地分析工作。对待数据,得引用《十全九美》的话,淡定,淡定!

    【一】    饕餮(Gluttony)
    星期一,电影里的大胖子撑死了。凶手把一罐罐的意大利面肉酱摆在胖子面前,胖子不断吃或者被动吃,还没来得及消化就撑死了。如同面对大量的数据,我们学到一些零碎的知识或是接受一些耳闻的认识,还没来得及深究就得运用了。于是问题来了。
    研究方法的知道需要考察精密度,准确度,检出限,线性范围等等参数,却不够清楚回收率是在反映什么,检出限有哪些分类;做标准曲线的时候思考过为什么要用y=ax+b来拟合吗,过不过零点又是什么含义呢;做试验设计,正交设计,均匀设计,析因设计,中心复合设计,Box-Behnken设计……看得眼花缭乱,都有什么适用条件,优缺点呢?
    我看到的是,懒得管检出限、内标法、标准加入法理论的神情,而是我这个该怎么算,该用什么方法;询问为什么我的标准曲线线性不好呢,或许它本来就不是线性的呐,并不是只有朗伯比尔定律;说起不确定度,就谈虎色变,绕来绕去就是难啊难啊难啊;文献里用试验设计的多了,各种设计软件就热了起来。
    或许该责怪这个急于求成的时代,让我们少了耐下心的性子,拿起书本,坐下来,细细领悟。读图的习性让我们求助于百度和谷歌,以及论坛的机会越来越多。我支持这样的求助,也期待更深的思索。

    构建一个彪悍的胃是面对暴食的好方法,但培养一个懂得判断的头脑更是标本兼治之策。

    【二】    贪婪(Greed)
    星期二,电影里的律师死掉了。因为不满足。见过参加能力验证的实验室用了国标1法,2法,3法,还是对结果不够满意,最后是电话接通了的状况。对资质和牌子的看重无可厚非,但更多时候它关系到个人的利益,而被过于看重了。
    实验室比对或是能力验证常采用稳健Z比分数法。公式 ,四分位距和Z值结果的判断决定了测定结果在总体中的位置比它具体的值更为重要,特别是中位值不是由参考值确定,而是各个实验室测定结果的平均值的时候。
    做了质控,平行,严格控制了操作误差,对自己的测定是很有信心的,没有信心的是能否在整体里占据个好位置。有个完全相信自己,不去打听的实验室,结果有一次居然就离群了,百思不得其解啊。当然这个不是能控制的,但谁在各地没个同学之类的啊,一个电话,一次qq,就能稳定军心,睡个踏实觉,诱惑啊。

    相信这只是很个别的情况,祝你|Z|≤2,站在中位值上仰望别的直方柱!

    【三】    懒惰(Sloth)
    星期三,电影里的毒贩挂了,懒到一整年没有出过门。惰性谁都有,可是也别忘了懒人推动着社会的进步。它是把双刃剑,一方面让我们追求更高效,一方面纵容我们更放松。
    前面的例子或许容易触碰某些神经,那就还是拿我自己来举例吧。在老师那儿被灌输了平行的思想,1次测定不能说明问题,2-3个平行才比较有把握。做那些判定是否符合限值的试样,遇到样品数量大的时候,做前处理就已经让人头疼了,再double,triple一下,头疼也就加倍了。因此有时我会这样做——前处理不做平行,测定时连续进样3次。如此一来,平行也有了,标准差也小了,合格也能判断了。我悔过……
    既然说开了,再讲一个例子也无妨。色谱分析有时1针要30分钟,标准曲线5个点做下来就是2个多小时了,一开机一进样,嗷~半天就没了,为了加快分析速度,就改做单点校正了,把标准跟之前测定的比较下,目测下没多大变化也就听之任之了。

    错误之举,请勿模仿。如有雷同,纯属巧合。

    【四】    欲望(Lust)
    星期四,电影里的妓女死了。我们总是期望好的实验结果,但天总不随人愿,越是想越会出现意外或是发现问题。当然也不能怪天,跟点背不能怨社会一样。
    用y=ax+b拟合标准曲线,可能出现截距比较大的情况。比如y=300x+50,计算样品浓度的时候就有疑惑了,如果样品的响应<50,那么浓度就计算不出来,这时候存在三种选择,一种是把截距给丢掉,那么响应为100的该怎么计算呢,要不要截距又是个麻烦,要的话,那么它跟响应是50计算出来的浓度就一样了,不要的话,那这个拟合出来的方程就没有意义了;另外一种是用强制过零重新拟合,这样倒是不会有不能计算的响应,但这就换了种模型进行拟合了,相关系数也可能变差,严格来说应该要对截距进行统计检验;第三种则是在考虑检出限的前提下,进行单点校正(色谱法居多)。至今,我也不明白遇到这样的情况究竟该怎么处理才是合理,也没有相关的标准或是经验可以借鉴。
    做更好的分析的意愿催促着我们选择更优的方法,标准加入法也一直被贴着能消除基质干扰的标签,但“消除”本身在哪里几乎都是不可能实现的,说能够消除误差的也是骗人的。它能减少的只是乘积性的干扰,对加和性或其他类型的干扰一样无能为力。

    理想跟现实的差距同样体现在分析中,不管你怀着多么强烈的求真愿望。即使不明白相对论,也要明白检测永远是相对的。要是都明白,那就更好了。

    【五】    傲慢 (Pride)
    星期五,电影里的美女自杀了。骄傲来自于自信,好的回收率就能给建立方法的我们带来这种自信。其实,回收率本身并不能说明那么多,它距离表明准确度很高还有不小的差距勒。
    通常的回收率做法是把一定量的标准溶液加入到样品中,再进行前处理,然后测定。但是对于固体样品来说,仍可能会有存于固体内部的待测物无法被提取出来,液态的标准能够被完全回收不能说明固体就被提取完全了;还有一种可能是,检测方法所能测定的只是某一种形态的待测物,拿金属来说,可能是某一种价态的。
    回收率不是万能的,傲慢是万万不能的。

    【六】    嫉妒(Envy)
    星期六,电影里生活幸福的妻子被斩首了。嫉妒,也称妒忌或忌妒,委婉的说法叫羡慕。对做仪器检定的人,我就很羡慕。
    那每年一张的小标签和一纸报告,看似不难,分量却极重。羡慕别人,就做好期间核查吧。说不定哪天就能跳槽让他人羡慕了。大家的实验室,期间核查做得如何呢?这个环节容易被繁忙的日常分析冲淡,带您温故而知新。
    公式是如此简单,步骤也不多,判定也不麻烦。
    式中:
    x——测量值;
    X——标准值(参考值);
    Ulab——实验室被考核设备的测量不确定度;
    Uref——参考标准的不确定度。
    结果判定
    E<1,表明仪器设备状态良好。
    E>1,则表明可能存在问题
    做自己的期间核查,让被嫉妒的人找不到茬吧。

  • 该帖子已被版主-老鱼加5积分,加2经验;加分理由:出发点很好,结构新颖,强烈推荐
    +关注 私聊
  • calfstone

    第1楼2009/02/22

    不好意思,jennysing楼层征用一下,第一个帖子字数太多发不完

    【七】    暴怒(Wrath)
    星期天,电影里的凶手按计划被杀了。我们存在,就一定有喜怒哀乐,实验亦是如此。
    分析时会有临界值的出现,不论是在检出限附近的数值,还是在需要跟限值的比较。怒就常常从中来了。复查是首选。几个平行样,计算下标准差,得出个置信区间的做法比较常见。这样自己也有了底气,“向善”还是我们的基调。更专业一点儿的还是计算不确定度之后来判断是否符合限值,能做到这个程度的应该不多。
    21世纪最重要的是和谐,愤怒当然越少越好。不过还有一句广告,做药就是做良心,做分析亦然。

    拉拉杂杂地说了七天,终于在期限内完成了。看着这些贬义的词汇也许造成了你的不适,有些说法可能也欠妥。匆忙之作,管窥之见,还请大家见谅并指点。
    数据处理方面的话题远不止这七点,今后还需各位版友多多支持和交流,也算小小的打个广告,前提是你有耐心看完此文,呵呵。
    数据处理版欢迎你!

    ps.感谢calfstone老师的指导!





    原文作者 calfstone 发表于2009-2-22 21:43:14
    鼓励中,有思考才有进步!

0
    +关注 私聊
  • 老多_小多

    第3楼2009/02/23

    我那天看到就觉得不好
    可是人家是斑竹,还得你们主管管啊
    建议最近要开斑竹进修班了

0
    +关注 私聊
  • jennysing

    第4楼2009/02/23

    呵呵,有问题请指出来,没有关系的。

    emoc98311 发表:我那天看到就觉得不好
    可是人家是斑竹,还得你们主管管啊
    建议最近要开斑竹进修班了

0
    +关注 私聊
  • 任禾

    第5楼2009/02/23

    一个电话,一次qq,有可能就让这个稳健Z失效了!!

    jennysing 发表:【二】    贪婪(Greed)
    星期二,电影里的律师死掉了。因为不满足。见过参加能力验证的实验室用了国标1法,2法,3法,还是对结果不够满意,最后是电话接通了的状况。对资质和牌子的看重无可厚非,但更多时候它关系到个人的利益,而被过于看重了。
    实验室比对或是能力验证常采用稳健Z比分数法。公式 ,四分位距和Z值结果的判断决定了测定结果在总体中的位置比它具体的值更为重要,特别是中位值不是由参考值确定,而是各个实验室测定结果的平均值的时候。
    做了质控,平行,严格控制了操作误差,对自己的测定是很有信心的,没有信心的是能否在整体里占据个好位置。有个完全相信自己,不去打听的实验室,结果有一次居然就离群了,百思不得其解啊。当然这个不是能控制的,但谁在各地没个同学之类的啊,一个电话,一次qq,就能稳定军心,睡个踏实觉,何乐而不为呢?
    相信这只是很个别的情况,祝你|Z|≤2,站在中位值上仰望别的直方柱!

0
    +关注 私聊
  • 天字一号猪

    第6楼2009/02/23

    应助达人

    写的有些深奥,本来七宗罪就看的一知半解的!
    不如把那些问题好好解释解释吧!

    jennysing 发表:关于傲慢 (Pride),嫉妒(Envy),暴怒(Wrath),懒惰(Sloth),贪婪(Greed),饕餮(Gluttony),以及欲望(Lust)


    七宗罪(Se7en)是大卫•芬奇在1995年拍摄的一部犯罪电影,曾获得奥斯卡和英国电影学院奖提名。「暴食」、「贪婪」、「懒惰」、「嫉妒」、「骄傲」、[淫欲]、「愤怒」,这是天主教教义所指的人性七宗罪。城市中发生的连坏杀人案,死者恰好都是犯有这些教义的人。凶手故弄玄虚的作案手法,令资深冷静的警员沙摩塞(摩根•弗里曼 Morgan Freeman 饰)和血气方刚的新扎警员米尔斯(布拉德•皮特 Brad Pitt 饰)都陷入了破案的谜团中。




    想起来了吗?还算青涩的皮特和刚经过肖申克救赎的弗里曼。

    以下解释来自维基:七宗罪,正式译名为七罪宗,属于人类恶行的分类,并由13世纪道明会神父圣多玛斯•阿奎纳列举出各种恶行的表现。天主教教义中提出‘按若望格西安和教宗额我略一世的见解,分辨出教徒常遇到的重大恶行’。但是‘重大恶行’与不可饶恕的大罪是不可混而一谈。
    在此,我们不讨论宗教,人性或是为电影叫好,而是来说说数据处理。虽然面对数据处理,我只是个新手。对日常分析工作的了解很有限,但透过论坛也多多少少有了些认识。因此斗胆归纳出了数据处理中的七宗罪。这些行为或许并不算重大,更谈不上不可饶恕的大罪。有些是习惯,是默契,有些是我们暂时还不能改变的现实。如同台词说:“我们到处都能看到罪恶,在街头,在每个家里,我们容忍,因为见怪不怪,没什么大不了,我们总是从早容忍到晚。”

    按照电影的顺序,来看看这七宗罪吧,那些不好的习惯我们有则改之,无则加勉。目的都是为了更好地分析工作。对待数据,得引用《十全九美》的话,淡定,淡定!

    【一】    饕餮(Gluttony)
    星期一,电影里的大胖子撑死了。凶手把一罐罐的意大利面肉酱摆在胖子面前,胖子不断吃或者被动吃,还没来得及消化就撑死了。如同面对大量的数据,我们学到一些零碎的知识或是接受一些耳闻的认识,还没来得及深究就得运用了。于是问题来了。
    研究方法的知道需要考察精密度,准确度,检出限,线性范围等等参数,却不够清楚回收率是在反映什么,检出限有哪些分类;做标准曲线的时候思考过为什么要用y=ax+b来拟合吗,过不过零点又是什么含义呢;做试验设计,正交设计,均匀设计,析因设计,中心复合设计,Box-Behnken设计……看得眼花缭乱,都有什么适用条件,优缺点呢?
    我看到的是,懒得管检出限、内标法、标准加入法理论的神情,而是我这个该怎么算,该用什么方法;询问为什么我的标准曲线线性不好呢,或许它本来就不是线性的呐,并不是只有朗伯比尔定律;说起不确定度,就谈虎色变,绕来绕去就是难啊难啊难啊;文献里用试验设计的多了,各种设计软件就热了起来。
    或许该责怪这个急于求成的时代,让我们少了耐下心的性子,拿起书本,坐下来,细细领悟。读图的习性让我们求助于百度和谷歌,以及论坛的机会越来越多。我支持这样的求助,也期待更深的思索。
    构建一个彪悍的胃是面对暴食的好方法,但培养一个懂得判断的头脑更是标本兼治之策。



    欲知后事如何,且听下回分解!
    敬请明日继续关注本帖

0
    +关注 私聊
  • 论坛管理员

    第7楼2009/02/23

    很有新意啊,希望LZ能够尽快写完。

0
    +关注 私聊
  • hnzhouqy

    第8楼2009/02/23

    "研究方法的知道需要考察精密度,准确度,检出限,线性范围等等参数,却不够清楚回收率是在反映什么,检出限有哪些分类;做标准曲线的时候思考过为什么要用y=ax+b来拟合吗,过不过零点又是什么含义呢;做试验设计,正交设计,均匀设计,析因设计,中心复合设计,Box-Behnken设计……看得眼花缭乱,都有什么适用条件,优缺点呢?"
    支持!
    但如果仅仅是这样提出问题,似乎就失去了他的意义,所以强烈建议楼主在历数数据处理的七宗罪后,详细的解读。

0
    +关注 私聊
  • 小鸟飞翔

    第9楼2009/02/23

    是啊,期待最终大作!

    4077 发表:很有新意啊,希望LZ能够尽快写完。

0
    +关注 私聊
  • jennysing

    第10楼2009/02/24

    是啊,同意!跟您握手!

    rrrr 发表:一个电话,一次qq,有可能就让这个稳健Z失效了!!

0
    +关注 私聊
  • jennysing

    第11楼2009/02/24

    很好的建议,一定详细解读!

    hnzhouqy 发表:但如果仅仅是这样提出问题,似乎就失去了他的意义,所以强烈建议楼主在历数数据处理的七宗罪后,详细的解读。

0
查看更多
猜你喜欢最新推荐热门推荐更多推荐
举报帖子

执行举报

点赞用户
好友列表
加载中...
正在为您切换请稍后...