2016-11-15 44 views
0

我可以通过ELKI运行变化的k来运行LOF,以便比较哪个k最好?ELKI:用变化的k运行LOF

通常你选择一个k,然后你可以看到例如ROCAUC。我想为数据集取出最好的k,所以我需要比较多个运行。我能做到这一点比手动更改k的值并执行运行更容易吗?我想举个例子比较所有k = [1-100]。

感谢

回答

0

Greedy Ensemble显示如何运行在一次有效的整个范围k的异常检测方法使用ComputeKNNOutlierScores应用程序(仅计算近邻一次,这将是快了很多!)包括与ELKI。

应用程序EvaluatePrecomputedOutlierScores可用于通过多种措施批量评估这些结果。

这是我们用于发布

GO坎波斯,A Zimek,J.桑德,RJGB Campello的,B.Micenková,E.舒伯特,一御批和ME埒
On the Evaluation of Unsupervised Outlier Detection: Measures, Datasets, and an Empirical Study
数据挖掘和知识发现30(4):891-927,2016年,DOI:10.1007/s10618-015-0444-8

supplementary material website,你可以看一下对许多标准数据集的最好成绩,以及下载r aw结果。

但请注意异常值检测质量结果往往不确定。在一个数据集上,一个方法表现最好,另一个数据集表示另一个方法。没有明确的赢家,因为数据集非常多样化。