txtb001
第3楼2016/12/14
这只是离群值的检测,实际上,一大堆数据的检测还有很多,离群值只是最后一项。
首先你要检测,数据的位置随时间的变化,有没有漂移?
其次面对大样本数据,要先做Bartlett测试,测试它是不是柯西分布,如果是柯西分布,还不能拿平均值作校验,只能拿中位值作数据的校验。
再次用滞后图检测数据的随机性,看看这些数据是人为设计,还是真实数据,随机的。
再再次用概率图检测数据是那种分布的?是正态的,还是均匀,还是双指数的,还是对数正态的,还是Weibull分布或Gamma分布?如果是正态分布的,用Shapiro-wilk检测,或Anderson-Darling检测下正态性,达到多大的正态。
再再再次用grubbs检测离群值,看看有多少数据离群。
最后形成一个模型、公式和概要报表。