k-means

0热度

1回答

我在找一些指导，请在导入PMML模型文件转换成河PMML是一种预测模型标记语言，它允许在一个系统中构建的模型部署在另一个系统中。我有几个模型已经过spss培训，并使用pmml保存为xml格式。他们是Logistic回归和k-means模型。我已经对导入pmml的r功能进行了详尽的搜索，并且发现在包中使用罕见的函数，例如Arules for Association模型。 R似乎对导出非常有用，但不

1热度

1回答

如何在R中进行并行化k-均值？

我有一个非常大的数据集（5000 * 100），我想用kmeans函数查找集群。但是，我不知道如何使用clusterApply函数。 set.seed(88) mydata=rnorm(5000*100) mydata=matrix(data=mydata,nrow = 5000,ncol = 100) parallel.a=function(i) { kmeans(mydata,3,n

0热度

1回答

根据聚类中心更改R中kmeans产生的聚类数

我在R中使用简单kmeans聚类单个向量。由于簇号相当随意分配（我假设），因此我需要按顺序获取它们（使用簇中心）。这里是一个〔实施例： > vals <- c(0.22, 0.17, 0.21, 0.13, 0.00) > set.seed(32833) > cl <- kmeans(vals ,3) > cl$cluster [1] 2 3 2 3 1 > cl$centers

2热度

1回答

使用反转距离的K均值聚类

首先，我想弄清楚如何应用这个算法来解决作业项目。所以，我不是在寻找作业解决方案，只是帮助完成我的算法来解决问题。我想使用K均值聚类来聚集大集（2^6）数组。这些数组是序列[0,1,2 ... 31]的唯一排列。但是，我不需要使用欧式距离，而需要使用反演距离。我在k-means中的第一步是从数据集中选择k = 10个随机点。然后我计算数据集中每个值到每个随机k点的反转距离。这给出了最初的聚类。

0热度

1回答

如何转换RGB形式的图像（2-D矩阵）

我有一个尺寸为128x128的图像。我已经应用matlab的imread功能， A = imread（first.jpg）; 但是，这是返回给我一个三维数组128x128x3，我如何将它转换为由3列R，G，B（每种颜色一列）组成的2-D矩阵？

0热度

1回答

查找集群编写中的R代码中的错误

我是比较新的R.我只是试图找出集群的最佳数目使用以下方法虹膜数据： library(datasets) head(iris) # method1: wss <- (nrow(iris)-1)*sum(apply(iris,2,var)) for (i in 2:3) wss[i] <- sum(kmeans(iris, centers=i)$withinss) pl

-1热度

1回答

如何在R中扭曲K-Means算法以找到服务人员的最优分配

我有一个客户列表（比如说300） - 和一个服务工程师列表（比如lat，long）。我需要以最佳方式为每位客户指派一名服务工程师。减少出差，增加参加顾客的能力。假设他必须定期参加所有客户。尝试K意味着集群，它应该将客户划分为10个集群并为每个客户分配服务工程师。任何暗示是赞赏。

-3热度

2回答

用于细长数据集的聚类K均值算法

我在Matlab中编程K均值算法时遇到了问题。为什么K-means算法不适合对细长数据集进行分类？

-8热度

1回答

这些R代码的含义？它们是相关的吗？

我探索虹膜数据中的R设置，我想在以下两个代码一些澄清：使用所述数据的所有情况下 cluster_iris<-kmeans(iris[,1:4], centers=3) iris$ClusterM <- as.factor(cluster_iris$cluster) 我认为第一个正在执行的k-means聚类分析文件，并且只有前3列有3个选择的列。但是我不确定第二段代码在做什么？第一个是说明

1热度

1回答

使用地球移动距离的聚类直方图距离R

我将数据表示为单个变量的许多不同直方图。我想确定使用无监督聚类的哪些直方图是相似的。我也想知道使用的最佳群集数量。我已阅读Earth Movers Distance度量作为度量直方图之间距离的度量，但不知道如何在通用聚类算法中使用该距离度量（例如，k均值）。主要：我用什么r软件包和函数来聚合直方图？中学：如何确定“最佳”数量的聚类？实施例数据集1（3单峰簇）： v1 <- rnorm(n=