k-means

0热度

1回答

假设，我必须对应于5个类别个连续程序10天每小时数据群集成员关系，创建为： library(xts) set.seed(123) timestamp <- seq(as.POSIXct("2016-10-01"),as.POSIXct("2016-10-10 23:59:59"), by = "hour") data <- data.frame(cat1 = rnorm(length(tim

0热度

1回答

将测试数据划分为matlab中的k均值簇

我有525个数据，我已经使用kmeans函数将它们聚类为2个部分。当我有一个测试数据时，我想把它放入一个集群。为此，我必须测量两个群集的测试数据和质心的距离。最低距离表示数据在该群集上。我该怎么做？ PS：数据有9个输入，这意味着每个数据由9个值组成。这是我曾尝试： for n = 1:174 for k = 1:9 testclust1(n,k) = C(1,k)-TES

1热度

1回答

k表示使用numpy - 计算每次迭代的误差

我正尝试使用numpy/scipy的k-means算法之一为学校项目执行图像量化（减少图像的颜色数量）。 algirithm工作正常，但我也想计算算法e.i.的每次迭代的误差总和。样本距其最近的聚类中心的距离总和（这是项目任务之一）。我无法找到任何kmeans方法的numpy或其他快速，优雅的方式执行此操作。有没有这样一种方法或方法，如果没有，执行这项任务的最佳方法是什么？我的目标是尽量减少现

0热度

1回答

使用基于连接距离的K-means plus plus聚类算法创建聚类

我有一组相互连接的节点（大约10K）。我必须创建小群集（最多15个节点）。我使用连接距离来查找两个节点之间的距离（使用Dijkstra最短路径算法）而不是地理空间距离。现在的问题是，使用K-means plus plus算法创建小群集需要花费1个多小时。我知道它需要更多时间来找到两个节点之间的最短距离。如果我想最初存储所有最短路径，它需要更多的内存（这是不可能的）。任何人都可以建议我如何优化

0热度

1回答

如何使用clv和clValid来找到最佳的聚类算法？

我开始尝试使用clv和/或clValid验证我的kmeans集群，但是我没有从clValid/clv docs或google获得太多帮助。 This site声称clValid会运行一堆不同的聚类方法并告诉我最好使用，但我不确定这是否与在R 3.2.2中使用的clValid相同。或者如果R有这种能力。到目前为止，我一直在使用自制循环来浏览一系列不同的kmeans场景（变化的k和nstart参数）

0热度

1回答

如何使用k-means和ID3算法对matlab中的图像进行分类？

我刚开始使用MATLAB。我应该做一个项目，使用k-means和ID3算法对图像进行分类。例如，考虑动物的数据库。图像必须根据颜色和纹理等特征进行分类。稍后可以通过输入动物的颜色，纹理和行为来检索这些图像。具有指定特征的动物将被检索。我如何使用MATLAB来实现这个项目？我可以得到该程序的解释吗？

1热度

1回答

k-means算法不起作用

我想在Python 3中使用Numpy实现k-means算法。我的输入数据矩阵是一个点的简单的N×2矩阵数据： [[1, 2], [3, 4], ... [7, 13]] 出于某种原因，在迭代的每个步骤，没有我的标签是相同的。每一个标签都是不同的。有人看到我在做什么明显的错误吗？我试图给我的代码添加一些评论，以便人们可以了解我正在做的各种步骤。 def kmeans(X,k):

0热度

1回答

Kmeans聚类和文本挖掘在R

我有一个包含twitter数据（只有1个文件）的txt文件。我使用streamR和parseTweets函数将它加载到R中。我需要对这些数据进行Kmeans聚类。首先，我需要清理和准备数据，但数据是数字的混合体，它不允许我这样做:(例如）内容转换。如何摆脱这些数据中所有不需要的字符？我只需要纯文本。无数字，特殊字符等 *library(streamR) install.packages("RC

0热度

1回答

如何使用fviz_nbclust

我需要帮助了解如何使用K-意味着R.集群我的代码 library(cluster) library(factoextra) #read data data<-read.csv("..\file.txt",header=FALSE, sep=" ") #determine number of clusters to use k.max<- 22 wss <- sapply(2:k

-1热度

2回答

k表示在matlab中ip地址数据的聚类

我有ip地址数据。我想对它应用k均值聚类。如何应用它。我可以在4维空间即数据映射数据具有 10.0.11.4 10.0.7.4 10.0.8.4 10.0.14.4 然后我可以映射数据，4维即 10 0 11 4 10 0 7 4 10 0 8 4 10 0 14 4