异常值的检测方法
异常值的检测方法主要有以下几种:
1. 3sigma:基于正态分布,3sigma准则认为超过3sigma的数据为异常点。
2. Z-score:标准分数,测量数据点和平均值的距离,若A与平均值相差2个标准差,Z-score为2。当把Z-score=3作为阈值去剔除异常点时,便相当于3sigma。
3. boxplot:箱线图时基于四分位距(IQR)找异常点的。
4. Grubbs假设检验:一种假设检验的方法,常被用来检验服从正态分布的单变量数据集(univariate data set)Y中的单个异常值。若有异常值,则其必为数据集中的最大值或最小值。
需要注意的是,使用Grubbs测试需要总体是正态分布的。Grubbs临界值可以查表得到,它由两个值决定:检出水平α(越严格越小),样本数量n,排除outlier,对剩余序列循环做 1-4 步骤。
如有侵权请及时联系我们处理,转载请注明出处来自
推荐文章
科技快看 网站地图广州壹创集信息科技有限公司 版权所有 粤ICP备2021122624号