0

我使用ELKI's SimplifiedHierarchyExtractionAnderbergHierarchicalClustering,LatLngDistanceFunctionminClSize = 100ELKI等级聚类 - “mrg_”群集对象

我看到旁边的"clu_" Clusters也有2-3 "mrg_" Clusters其中有一些DBID's,但它的数量是< minClSize

我的问题是:什么是处理这种"mrg_" Clusters?的最佳方式:

  • 通过其DBID´s"clu_" children之一?
  • 把它们当作a cluster虽然它们是在minClSize之下吗?
  • 干脆忽略它们?

回答

1

这是一个分层的结果。

您需要将所有子集群包括到集群中。

所以mrg_集群有一些(可能是0个)新对象,加上子集群中的所有对象。特别是它可以有多个子集群(这就是为什么它被称为合并

+0

所以你的意思是,如果我有一个'mrg_'其中包含4个'DBID's'并且有两个孩子:'一个clu_和另外一个mrg_',那么我应该考虑由'mrg_'的所有'clu_'孩子和他的'mrg_ child'组成的一个簇? – Paul

+0

是的。来自所有孩子的所有对象也属于这个集群。我们不存储多余的会员资格。 –

+0

但如果我这样做,那么我最终会得到少量的集群。 – Paul