我有一个有向图(实际上它是一个超图,但它可以忽略这一刻)。排名集群的质量
从这张图我挑选各种子图,我正在寻找一个函数,通过它们的“群集质量”来排列各种这样的子集。
“集群质量”应该是高时的子集的成员之间存在很多链接
“集群质量”应该是低的,当从所述子集中的许多成员或从该子集之外存在很多链接。
我的问题是:
什么是 '集群质量' 正确的说法?
在这种情况下确实存在哪些相关算法/函数?
JVM上存在哪些实现。斯卡拉首选,但从Java可以调用的东西很好?
背景:这个想法是提取从源代码字(类&方法名称或其片段),并找到那些可能通过查找那些由“好簇”,从而可能代表用来更好地描述该应用程序代码中的一些知识概念。