仪器信息网APP
选仪器、听讲座、看资讯

格鲁布斯异常值检验法的前提是否要求数据呈现正态分布?

  • 枪手怪蜀黍
    2013/04/08
  • 私聊

数据处理

  • 0.320
    0.320
    0.330
    0.350
    0.350
    0.370
    0.370
    0.380
    0.400
    0.400
    0.410
    0.410
    0.440
    0.480
    0.490
    0.490
    0.500
    0.500
    0.500
    0.540

    以上这组数据是我们一个实验员用多台GCMS测定塑料中的邻苯二甲酸酯的结果,单位是%,也就是说0.32%=3200mg/kg,0.54%=5400mg/kg,我们将这组平均值为0.418,查表得知20组数据双尾检验表95%置信概率临界值为2.71,用格鲁布斯检验0.32这个数值算得的G值为1.402<2.71,说明0.32这数值与其他数据是没有显著性差异的,但是我从这20组数据来看,分散性相当大,极差高达0.22%,即检测结果高达2200mg/Kg的差别,如此大的分散性数据,可能都已经不是处于正态分布的状况,这种情况下,采用格鲁布斯检验法检验异常值还有意义吗?
  • 该帖子已被版主-透明加2积分,加2经验;加分理由:话题
    +关注 私聊
  • alphastatist

    第1楼2013/04/09

    需要正态分布的前提,可以考虑先做正态性检验。方法有Aderson-Darling、Shapiro-Wilks检验等等,但是由于数据量原因也许容易通过正态检验(注意通过并不表示正态分布一定对,只是表示没有证据表明正态假定不对)。

0
  • 该帖子已被版主-透明加2积分,加2经验;加分理由:互助
    +关注 私聊
  • calfstone

    第2楼2013/04/22

    目前的离群值outlier 检测一般基于近似正态分布假设除了Dixon tests,可采用以下方法:

    1、Hampel's Rule,基于改良Z得分值

    2、Grubbs' Test 用于单个离群值检测,但不推荐连续使用于多个离群值。

    3、Tietjen-Moore Test ,为Grubbs' Test的改进方法,可用于多个离群值。

    4、Generalized Extreme Studentized Deviate (ESD) Test,可用于探测有多少离群值,并给出统计检验的结果。

    5、Dixon-type tests,适用于小样本非正态分布数据。只适用于数据中的最大最小值的检验。

    对于非正态分布数据,可考虑数据转换,如对数转换后边近似正态,然后采用以上方法。

    对于你的数据,建议做正态检验,在描述性统计基础上考虑可能的分布和离群值多少,可考虑用ESD方法。

0
  • 该帖子已被版主-透明加2积分,加2经验;加分理由:互助
    +关注 私聊
  • 透明

    第3楼2013/04/22

    应该剔除离群值再算吧

0
猜你喜欢最新推荐热门推荐更多推荐
举报帖子

执行举报

点赞用户
好友列表
加载中...
正在为您切换请稍后...