k-means

0热度

2回答

我想对于k进行聚类聚类数据如下所示： https://cwiki.apache.org/MAHOUT/clustering-of-synthetic-control-data.html 然而，当映射精简工作即将发生我得到的错误 11/10/16 21:05:57 INFO mapred.JobClient: Task Id : attempt_201110161920_0008_m_000000_

0热度

2回答

Lloyd's算法

是否可以运行Lloyd算法来查找多项式时间中的一维k-均值？我知道k-means问题对于任何不止一维的NP-hard问题。任何如果你有一个固定的维度，劳埃德的算法将在多项式时间运行，对不对？

25热度

3回答

优化聚类一维数据？

有没有人有文章解释Ckmeans.1d.dp算法的工作原理？或者：在一维中进行k-means聚类的最优方法是什么？

4热度

3回答

带有椭圆体的k-means

我在R^3中有n个要用k个椭圆体或圆柱体覆盖的点（我并不在乎，哪个更容易）。我想尽量减少卷的联合。假设n是数万，k是少数。开发时间（即简单性）比运行时更重要。很明显，我可以运行k-means并使用完美的球体作为我的椭球体。或者我可以运行k-means，然后使用每个簇的最小封闭椭球而不是用球覆盖，尽管在最坏的情况下这并不好。我已经看过用k-means来处理各向异性的讨论，但我看到的链接似乎认为我手

13热度

1回答

如何指定R中kmeans的距离度量？

我做中的R k均值聚类有两个要求：我需要用户自己指定距离的功能，现在它的Pearson相关系数。我想要使用群组成员的平均值作为质心的群集，而不是一些实际的成员。这个要求的原因是我认为使用平均值作为质心比使用实际成员更有意义，因为成员总是不在真实质心附近。如果我对此有错，请纠正我。首先我试过kmeans功能stat包，但此功能不会允许自定义距离法。然后我发现pam函数在cluster包中。

12热度

3回答

哪里可以找到可靠的K-medoid（非K-means）开源软件/工具？

我正在学习K-medoids算法，所以如果我提出不恰当的问题，我很抱歉。据我所知，K-medoids算法实现了K-means聚类，但使用实际数据点作为质心而不是数学计算方法。当我在网上搜索时，发现了很多k-means工具，如GenePattern，geWengh等等，但不是k-medoids的。一些好朋友向我表明，在Matlab中，也有一些用户写的。但是，我担心个人实施的工具可能仍然存在一些缺陷

1热度

1回答

kmeans matlab code feed自己的数据源

我想在我自己的文件上试试这个K-means聚类代码我该如何改变它，以便它不会创建随机信息，而是从我自己的数据源中读取它？ %% generate sample data K = 3; numObservarations = 100; dimensions = 3; data = rand([numObservarations dimensions]); %% cluster opts

1热度

2回答

K-Means的替代品和性能

我一直在阅读关于相似性度量和图像特征提取;大多数论文都把k均值作为一个很好的统一聚类技术，我的问题是，对于一个特定的集合，k均值聚类有更好的表现吗？

0热度

1回答

有关命名约定的脚本错误

当我尝试运行我的kmeans.m脚本时，我将一些数据存储在一个mat文件电子表格中我收到此错误，并且我无法确定发生了什么事？ Attempt to execute SCRIPT kmeans as a function Error in ==> kmeans at 10 [clustIDX, clusters, interClustSum, Dist] = kmeans(data,

2热度

1回答

模糊K模式聚类如何找到聚类中心

我想了解fuzzy k-modes算法（主要看第3页）以实现它。我卡在计算集群中心他们说如图所示的PIC 我需要知道是否以下是真还是假，请大家指正在为了得到簇的中心我们需要：对于变量中的每个类别计算所有po的隶属度值之和INT，该类别属于，这个集群所获得的最高值被设置为中心