我正尝试使用ELKI进行异常值检测;我有我的自定义距离矩阵,我试图将它输入到ELKI以执行LOF(例如,第一次)。ELKI - 输入距离矩阵
我尝试关注http://elki.dbs.ifi.lmu.de/wiki/HowTo/PrecomputedDistances,但这并不是很清楚。我做什么:
我不希望加载从数据库中的数据,所以我使用:
-dbc DBIDRangeDatabaseConnection -idgen.count 100
(其中100是对象的数量,我会分析)
我用LOF算法中并调用外部距离文件
-algorithm outlier.LOF -algorithm.distancefunction external.FileBasedDoubleDistanceFunction -distance.matrix testData.ascii -lof.k 3
我的距离文件如下(用于测试目的很简单)
0 0 0
0 1 1
0 2 0.2
0 3 0.1
1 1 0
1 2 0.9
1 3 0.9
2 2 0
2 3 0.2
3 3 0
4 0 0.23
4 1 0.97
4 2 0.15
4 3 0.07
4 4 0
5 0 0.1
5 1 0.85
5 2 0.02
5 3 0.15
5 4 0.1
5 5 0
6 0 1
6 1 1
6 2 1
6 3 1
等
结果说:“都在一个平凡的集群”,虽然这不是群集和有绝对是离群我的数据。
我做的东西是否正确?或者我错过了什么?