首页 / 科技数码 / 正文

机器学习笔记六:sklearn四种异常检测算法比较以及实现异常检测

一、异常检测算法介绍

sklearn.svm.OneClassSVM :对异常值敏感,因此对于异常值检测效果不佳。当训练集不受异常值污染时,此估计器最适合新数据检测;而且,在高维空间中检测异常值,或者不对基础数据的分布进行任何假设都是非常具有挑战性的,而 One-class SVM 在这些情况下可能会得到有用的结果,如果超参数设置合适的话。

二、异常点检测实例

此实例显示了2D数据集上不同异常检测算法的特征。数据集包含一种或两种模式(高密度区域),以说明算法处理多模式数据的能力。示例中有5个数据集,对于每个数据集,将生成15%的样本作为随机均匀噪声。该比例是为 OneClassSVM 的 nu 参数和其他异常值检测算法的污染参数提供的值。离群值的决策边界以黑色显示,但局部离群值因子(LOF)除外,因为当用于离群值检测时,它没有适用于新数据的预测方法。

如有侵权请及时联系我们处理,转载请注明出处来自