cluster-analysis

    1热度

    1回答

    我不确定这个问题在这里是否合适。无论如何,这里的人似乎很有帮助。所以这是我的问题。 在k均值聚类的情况下,有必要给出聚类的初始位置。 为什么簇的不同初始位置影响最终的聚类结果?

    4热度

    3回答

    我熟悉各种聚类算法(k-means等),但对于我的特定用例(社交网络),我需要一种算法来检测重叠的组。这个算法将我的Facebook朋友整齐地分离成我的高中朋友,我的大学朋友,我的家人和我的工作朋友。 我上面使用的算法(JUNG的VoltageClusterer)将节点分成单个集群。但是我想要一种算法,可以为多个节点分配节点(例如,我的一个朋友可以是我的高中朋友和大学朋友)。 我该怎么做?如果我可

    6热度

    2回答

    我有2000组数据,每组数据包含1000多个2D变量。我期望根据相似性将这些数据集群集中到20-100个群集中的任何位置。但是,我无法提出比较数据集的可靠方法。我尝试了一些(相当原始的)方法并完成了大量的研究,但我似乎找不到适合我需要的任何东西。 我已经发布了一张图片,下面是我绘制的3组数据。数据在y轴范围内为0-1,在x轴范围内为0-0.10(实际上,但理论上可能大于0.10)。 数据的形状和相

    1热度

    2回答

    我正在写一个遗传算法,试图选择一组数据点以最大化集群间距离,同时保持两簇之间的簇内距离很小。 我认为像Davies-Bouldin指数这样的群集有效性度量是一个很好的适应度函数,但我正在努力寻找伪代码或java代码中算法的实现。 有人可以帮我吗? 谢谢。

    1热度

    1回答

    我正在制作一个应用程序,根据每个单词/短语内容将一组文档(范围从最少~10个文档到最多〜2000个)文件。每个文档的范围可以从一段文字到大约一页半。 我不是在寻找一个文档聚类库,它可以根据初始搜索词对结果进行聚类,但是可以在没有搜索词的情况下进行聚类。 是否有任何可以轻松集成Objective-C项目的文档集群?

    5热度

    2回答

    我想用kmeans聚类矩阵,并能够将其绘制为热图。这听起来很琐碎,我看过很多这样的情节。我尝试过google,但是找不到方法。 我希望能够在此图上绘制类似面板A或B的内容。 假设我有一个250行5列的矩阵。我不想聚集列,只是行。 m = matrix(rnorm(25), 250, 5) km = kmeans(m, 10) 那么我该如何绘制这10个集群作为热图?您的意见和帮助不仅仅是欢迎

    5热度

    2回答

    我是数据挖掘和实验的新手。 比方说,我有N个推特用户,而我想找的是 是他们写作的整体主题(基于推文)。 然后我想给每个主题更高的权重,如果该用户有更高的追随者。 然后我想合并所有的主题,如果有足够的相似但仍然保留加权按twitter计数。 所以基本上由权威机构评定为“重要”的主题(用户的Twitter计数) 例如,像news.google.com但排名名单将基于Twitter的追随者,负责主题。

    2热度

    2回答

    我是整个分布式系统领域的新手。我需要帮助来了解如何在此环境中形成群集,并决定哪个是CH(群集标题)。我想用生成树来选择能量最高的节点作为CH。当选择CH时,其他节点应将其信息发送给CH,CH将其发送到基站(红色节点)。 问题是我不知道该算法应该如何。下面是一些算法,我试图做 聚类算法 每隔一小时,节点启动生成树找到包含大部分能量的节点 如果它收到一个“搜索”的一个节点的消息: - 如果来自发送方的

    2热度

    1回答

    我已成功运行mahout lda,并使用命令mahout ldatopics显示输出。 例如我的主题是科学和运动。那么输出将是这样的: 话题0 篮球, 播放, 棒球 话题1个 研究, 研究, 理念现在 我的问题是我怎么能,识别个人物品的团体或集群。 是否有ID号或某种跟踪,以便我添加的每个新文章都将被分组或添加到特定的群集/主题。 如果我已经有了集群,下一步是什么? 感谢

    1热度

    1回答

    我用的OpenLayers clustter策略从GeoServer的群集的数据集。 我用于簇的造型下面的代码。 var myStyle = new OpenLayers.Style({ pointRadius :20, fillColor :'#FFFF00', fillOpacity :0.5, strokeColor :