0
我使用ELKI's SimplifiedHierarchyExtraction
与AnderbergHierarchicalClustering
,LatLngDistanceFunction
和minClSize = 100
。ELKI等级聚类 - “mrg_”群集对象
我看到旁边的"clu_" Clusters
也有2-3 "mrg_" Clusters
其中有一些DBID's
,但它的数量是< minClSize
。
我的问题是:什么是处理这种"mrg_" Clusters?
的最佳方式:
- 通过其
DBID´s
其"clu_" children
之一? - 把它们当作
a cluster
虽然它们是在minClSize
之下吗? - 干脆忽略它们?
所以你的意思是,如果我有一个'mrg_'其中包含4个'DBID's'并且有两个孩子:'一个clu_和另外一个mrg_',那么我应该考虑由'mrg_'的所有'clu_'孩子和他的'mrg_ child'组成的一个簇? – Paul
是的。来自所有孩子的所有对象也属于这个集群。我们不存储多余的会员资格。 –
但如果我这样做,那么我最终会得到少量的集群。 – Paul