cluster-analysis

1热度

1回答

我不确定这个问题在这里是否合适。无论如何，这里的人似乎很有帮助。所以这是我的问题。在k均值聚类的情况下，有必要给出聚类的初始位置。为什么簇的不同初始位置影响最终的聚类结果？

4热度

3回答

我熟悉各种聚类算法（k-means等），但对于我的特定用例（社交网络），我需要一种算法来检测重叠的组。这个算法将我的Facebook朋友整齐地分离成我的高中朋友，我的大学朋友，我的家人和我的工作朋友。我上面使用的算法（JUNG的VoltageClusterer）将节点分成单个集群。但是我想要一种算法，可以为多个节点分配节点（例如，我的一个朋友可以是我的高中朋友和大学朋友）。我该怎么做？如果我可

6热度

2回答

比较2D数据/散点图组

我有2000组数据，每组数据包含1000多个2D变量。我期望根据相似性将这些数据集群集中到20-100个群集中的任何位置。但是，我无法提出比较数据集的可靠方法。我尝试了一些（相当原始的）方法并完成了大量的研究，但我似乎找不到适合我需要的任何东西。我已经发布了一张图片，下面是我绘制的3组数据。数据在y轴范围内为0-1，在x轴范围内为0-0.10（实际上，但理论上可能大于0.10）。数据的形状和相

1热度

2回答

Davies-Bouldin Index in Java

我正在写一个遗传算法，试图选择一组数据点以最大化集群间距离，同时保持两簇之间的簇内距离很小。我认为像Davies-Bouldin指数这样的群集有效性度量是一个很好的适应度函数，但我正在努力寻找伪代码或java代码中算法的实现。有人可以帮我吗？谢谢。

1热度

1回答

Objective-C中的文档聚类

我正在制作一个应用程序，根据每个单词/短语内容将一组文档（范围从最少~10个文档到最多〜2000个）文件。每个文档的范围可以从一段文字到大约一页半。我不是在寻找一个文档聚类库，它可以根据初始搜索词对结果进行聚类，但是可以在没有搜索词的情况下进行聚类。是否有任何可以轻松集成Objective-C项目的文档集群？

5热度

2回答

R绘制kmeans与热图聚类

我想用kmeans聚类矩阵，并能够将其绘制为热图。这听起来很琐碎，我看过很多这样的情节。我尝试过google，但是找不到方法。我希望能够在此图上绘制类似面板A或B的内容。假设我有一个250行5列的矩阵。我不想聚集列，只是行。 m = matrix(rnorm(25), 250, 5) km = kmeans(m, 10) 那么我该如何绘制这10个集群作为热图？您的意见和帮助不仅仅是欢迎

5热度

2回答

很好的算法来寻找推文按照追随者的数量排列的主题？

我是数据挖掘和实验的新手。比方说，我有N个推特用户，而我想找的是是他们写作的整体主题（基于推文）。然后我想给每个主题更高的权重，如果该用户有更高的追随者。然后我想合并所有的主题，如果有足够的相似但仍然保留加权按twitter计数。所以基本上由权威机构评定为“重要”的主题（用户的Twitter计数）例如，像news.google.com但排名名单将基于Twitter的追随者，负责主题。

2热度

2回答

如何在此环境中形成群集并选择群集标头？

我是整个分布式系统领域的新手。我需要帮助来了解如何在此环境中形成群集，并决定哪个是CH（群集标题）。我想用生成树来选择能量最高的节点作为CH。当选择CH时，其他节点应将其信息发送给CH，CH将其发送到基站（红色节点）。问题是我不知道该算法应该如何。下面是一些算法，我试图做聚类算法每隔一小时，节点启动生成树找到包含大部分能量的节点如果它收到一个“搜索”的一个节点的消息： - 如果来自发送方的

2热度

1回答

确定Mahout LDA输出上的文档ID

我已成功运行mahout lda，并使用命令mahout ldatopics显示输出。例如我的主题是科学和运动。那么输出将是这样的：话题0 篮球，播放，棒球话题1个研究，研究，理念现在我的问题是我怎么能，识别个人物品的团体或集群。是否有ID号或某种跟踪，以便我添加的每个新文章都将被分组或添加到特定的群集/主题。如果我已经有了集群，下一步是什么？感谢

1热度

1回答

改变的OpenLayers杂波半径

我用的OpenLayers clustter策略从GeoServer的群集的数据集。我用于簇的造型下面的代码。 var myStyle = new OpenLayers.Style({ pointRadius :20, fillColor :'#FFFF00', fillOpacity :0.5, strokeColor :