2015-10-14 24 views
1

我使用ELKI GUI来运行DBSCAN算法。我的输入是一个CSV文件。我创建了一个投影作为功能选择:如何在ELKI DBSCAN结果中识别我的对象?

-dbc.filter transform.ProjectionFilter -projection NumericalFeatureSelection -projectionfilter.selectedattributes 1,2 

ELKI给我一些文件作为群集。这些文件仅包含投影属性,而其他属性如用户标识不存在。我如何识别集群中每个对象的UserId

回答

2

最简单的方法是不使用投影删除不需要的列(这将字面上删除这些列),而是把他们当作标签。因为这就是他们的标签。

通常情况下,最可靠的方法是在每个对象中包含一个唯一标识符(对象标签),如果您希望能够确定之后的点。

换句话说,使用

-parser.labelIndices 0 

,而不是你的过滤器(选择你的标签栏,当然 - 假设你的用户ID是列0)。