2017-07-14 37 views
2

有人可以请我指出Robust-PCA或基于角度异常值检测(ABOD)等算法的强大python实现吗?我尝试了一些Robust-PCA的python实现,但它们的内存密集程度非常高,程序崩溃了。我的数据集是60,000 X 900浮点数。 R有一个ABOD的实现,但我想坚持python。使用python进行高维异常检测

回答

1

异常值检测非常重要,有大量的研究出版物处理它。 基于密度的算法的可扩展性并不是真正的高性能。 我使用PCA降低维数,并使用局部离群因子方法。

您可以在海量数据良好实现版本: https://github.com/damjankuznar/pylof/blob/master/lof.py

HTH

+0

另外值得一提的是,这是实行的是当前版本的'scikit learn':HTTP:// scikit学习.ORG /稳定/模块/ outlier_detection.html – Y0da