calfstone
第2楼2013/04/22
目前的离群值outlier 检测一般基于近似正态分布假设除了Dixon tests,可采用以下方法:
1、Hampel's Rule,基于改良Z得分值
2、Grubbs' Test 用于单个离群值检测,但不推荐连续使用于多个离群值。
3、Tietjen-Moore Test ,为Grubbs' Test的改进方法,可用于多个离群值。
4、Generalized Extreme Studentized Deviate (ESD) Test,可用于探测有多少离群值,并给出统计检验的结果。
5、Dixon-type tests,适用于小样本非正态分布数据。只适用于数据中的最大最小值的检验。
对于非正态分布数据,可考虑数据转换,如对数转换后边近似正态,然后采用以上方法。
对于你的数据,建议做正态检验,在描述性统计基础上考虑可能的分布和离群值多少,可考虑用ESD方法。