首页 / 科技百科 / 正文

异常值的检测方法 

异常值的检测方法主要有以下几种:

1. 3sigma:基于正态分布,3sigma准则认为超过3sigma的数据为异常点。

2. Z-score:标准分数,测量数据点和平均值的距离,若A与平均值相差2个标准差,Z-score为2。当把Z-score=3作为阈值去剔除异常点时,便相当于3sigma。

3. boxplot:箱线图时基于四分位距(IQR)找异常点的。

4. Grubbs假设检验:一种假设检验的方法,常被用来检验服从正态分布的单变量数据集(univariate data set)Y中的单个异常值。若有异常值,则其必为数据集中的最大值或最小值。

需要注意的是,使用Grubbs测试需要总体是正态分布的。Grubbs临界值可以查表得到,它由两个值决定:检出水平α(越严格越小),样本数量n,排除outlier,对剩余序列循环做 1-4 步骤。

如有侵权请及时联系我们处理,转载请注明出处来自