cluster-analysis

    -2热度

    2回答

    是否有任何可用于执行“凝聚聚类”的java文件 结果应该为我提供每个级别的节点id help .................

    24热度

    3回答

    我正在寻找一种方法来分别在矩阵行和列上执行聚类,重新排列矩阵中的数据以反映聚类并将它们放在一起。聚类问题很容易解决,树状图创建也很容易解决(例如在this blog或"Programming collective intelligence"中)。但是,如何重新排序数据仍然不清楚。最终,我正在寻找一种使用朴素Python(使用任何“标准”库(如numpy,matplotlib等),但没有using

    4热度

    1回答

    大多数人都使用某种IoC框架 - Guice,Spring,您可以将其命名。我们中的许多人需要扩展他们的应用程序,所以他们使用Terracotta,Glassfish/JBoss/insert您的应用程序集群来使他们的生活复杂化。 但是真的要走吗?你在使用上述任何一种吗? 下面是我们目前在一个尚未开放的框架中实现的一些想法,我想看看您对它的看法,或者“这完全是XY的剽窃!”。 集群范围的对象复制

    1热度

    2回答

    我的问题相当复杂,我解释,因为我不擅长数学,但我会尽量做到尽可能清楚。 我试图在python中编写一个集群,它将生成给定字符集(即小写字母:aaaa,aaab,aaac,...,zzzz)的单词并对它们进行各种操作。 我正在寻找如何计算,给定字符集和节点数量,每个节点应该工作的范围(即:node1:aaaa-azzz,node2:baaa-czzz,node3:daaa-ezzz,...) 。是否

    6热度

    1回答

    1)我使用scipy的hcluster模块。 所以我控制的变量是阈值变量。 我如何知道每个门槛的表现?即在Kmeans中,这个性能将是所有点到它们质心的总和。当然,这是必须调整的,因为更多的群集=通常距离更小。 有没有我能用hcluster做这件事的观察? 2)我意识到有大量的指标可用于fclusterdata。我是基于tf-idf关键术语的文本文档聚类。这笔交易是,一些文件比其他文件长,我认为余

    0热度

    2回答

    对,所以我试图在C++中使用C库,从未真正做过这件事,我认为这将是一个声明头包括一个外部“C”和设置编译为标志为“默认”,但我仍然收到链接器错误,并认为头文件可能必须作为DLL编译。我真的不知道。 是图书馆是问题还是我? cluster-1.47 \ src中有一些make文件,但我不知道如何或如果它们与“cluster.h”相关。我已经上传了一个视觉工作室2008项目,任何人都可以采取行动,任何

    11热度

    2回答

    我有一个树形图给我作为图像。由于它不是很大,我可以将它“手工”构造成一个R对象。 所以我的问题是如何手动创建树状图(或“hclust”)对象,当我拥有的是树状图像? 我看到有一个叫做“as.dendrogram”的函数,但我没有找到如何使用它的例子。 (PS:这篇文章是由here以下我的问题) 非常感谢, 塔尔

    13热度

    2回答

    许多用于聚类的算法都可用。一种流行的算法是K均值,其中基于给定数量的聚类,该算法迭代以找到对象的最佳聚类。 您使用什么方法确定k均值聚类中数据中的聚类数量? R中包含的任何包是否包含V-fold cross-validation方法来确定正确的群集数? 另一个很好用的方法是期望最大化(EM)算法,它为每个实例分配一个概率分布,以指示它的概率属于每个集群。 该算法在R中实现吗? 如果是,它是否可以通

    3热度

    2回答

    我试图检测输入矢量如何适合给定的聚类中心。我可以很容易地找到最佳匹配(与输入矢量最小欧几里得距离的中心是最好的),但是,现在我需要工作的比赛有多好。 为此,我需要找到构成质心的向量的扩展(标准偏差?),然后查看从我的输入向量到中心的距离是否小于扩展。如果它比传播更多,那么我应该可以说我没有群集来适应它(因为最好的输入向量不适合)。 我不知道如何找到每个群集的传播。我拥有所有的中心矢量,并且所有的训

    11热度

    6回答

    我需要可视化相对较大的图(6K节点,8K边缘),其具有以下性质: 不同的集群。每簇和中度互连性约50-100节点在集群级别 最小(5-10每簇群集间边缘)的簇之间的互连性 让整体边缘重叠=边缘重叠通过直接可视化引起集群的图形= {A,B,C,D,E},边缘=这些集群的边缘,这是非平面的,并且如果直接绘制它将肯定会产生边缘重叠} 让本地边缘重叠=上面,但{A,B,C,D,E}只是节点。 我需要可视化