k-means

    0热度

    1回答

    假设,我必须对应于5个类别个连续程序10天每小时数据群集成员关系,创建为: library(xts) set.seed(123) timestamp <- seq(as.POSIXct("2016-10-01"),as.POSIXct("2016-10-10 23:59:59"), by = "hour") data <- data.frame(cat1 = rnorm(length(tim

    0热度

    1回答

    我有525个数据,我已经使用kmeans函数将它们聚类为2个部分。当我有一个测试数据时,我想把它放入一个集群。为此,我必须测量两个群集的测试数据和质心的距离。最低距离表示数据在该群集上。 我该怎么做? PS:数据有9个输入,这意味着每个数据由9个值组成。 这是我曾尝试: for n = 1:174 for k = 1:9 testclust1(n,k) = C(1,k)-TES

    1热度

    1回答

    我正尝试使用numpy/scipy的k-means算法之一为学校项目执行图像量化(减少图像的颜色数量)。 algirithm工作正常,但我也想计算算法e.i.的每次迭代的误差总和。样本距其最近的聚类中心的距离总和(这是项目任务之一)。 我无法找到任何kmeans方法的numpy或其他快速,优雅的方式执行此操作。 有没有这样一种方法或方法,如果没有,执行这项任务的最佳方法是什么?我的目标是尽量减少现

    0热度

    1回答

    我有一组相互连接的节点(大约10K)。我必须创建小群集(最多15个节点)。 我使用连接距离来查找两个节点之间的距离(使用Dijkstra最短路径算法)而不是地理空间距离。 现在的问题是,使用K-means plus plus算法创建小群集需要花费1个多小时。我知道它需要更多时间来找到两个节点之间的最短距离。如果我想最初存储所有最短路径,它需要更多的内存(这是不可能的)。 任何人都可以建议我如何优化

    0热度

    1回答

    我开始尝试使用clv和/或clValid验证我的kmeans集群,但是我没有从clValid/clv docs或google获得太多帮助。 This site声称clValid会运行一堆不同的聚类方法并告诉我最好使用,但我不确定这是否与在R 3.2.2中使用的clValid相同。或者如果R有这种能力。 到目前为止,我一直在使用自制循环来浏览一系列不同的kmeans场景(变化的k和nstart参数)

    0热度

    1回答

    我刚开始使用MATLAB。我应该做一个项目,使用k-means和ID3算法对图像进行分类。 例如,考虑动物的数据库。图像必须根据颜色和纹理等特征进行分类。稍后可以通过输入动物的颜色,纹理和行为来检索这些图像。具有指定特征的动物将被检索。 我如何使用MATLAB来实现这个项目?我可以得到该程序的解释吗?

    1热度

    1回答

    我想在Python 3中使用Numpy实现k-means算法。我的输入数据矩阵是一个点的简单的N×2矩阵数据: [[1, 2], [3, 4], ... [7, 13]] 出于某种原因,在迭代的每个步骤,没有我的标签是相同的。每一个标签都是不同的。有人看到我在做什么明显的错误吗?我试图给我的代码添加一些评论,以便人们可以了解我正在做的各种步骤。 def kmeans(X,k):

    0热度

    1回答

    我有一个包含twitter数据(只有1个文件)的txt文件。我使用streamR和parseTweets函数将它加载到R中。我需要对这些数据进行Kmeans聚类。首先,我需要清理和准备数据,但数据是数字的混合体,它不允许我这样做:(例如)内容转换。 如何摆脱这些数据中所有不需要的字符?我只需要纯文本。无数字,特殊字符等 *library(streamR) install.packages("RC

    0热度

    1回答

    我需要帮助了解如何使用K-意味着R.集群 我的代码 library(cluster) library(factoextra) #read data data<-read.csv("..\file.txt",header=FALSE, sep=" ") #determine number of clusters to use k.max<- 22 wss <- sapply(2:k

    -1热度

    2回答

    我有ip地址数据。我想对它应用k均值聚类。如何应用它。我可以在4维空间即数据映射数据具有 10.0.11.4 10.0.7.4 10.0.8.4 10.0.14.4 然后我可以映射数据,4维即 10 0 11 4 10 0 7 4 10 0 8 4 10 0 14 4