k-means

    0热度

    1回答

    我在找一些指导,请在导入PMML模型文件转换成河PMML是一种预测模型标记语言,它允许在一个系统中构建的模型部署在另一个系统中。我有几个模型已经过spss培训,并使用pmml保存为xml格式。他们是Logistic回归和k-means模型。 我已经对导入pmml的r功能进行了详尽的搜索,并且发现在包中使用罕见的函数,例如Arules for Association模型。 R似乎对导出非常有用,但不

    1热度

    1回答

    我有一个非常大的数据集(5000 * 100),我想用kmeans函数查找集群。但是,我不知道如何使用clusterApply函数。 set.seed(88) mydata=rnorm(5000*100) mydata=matrix(data=mydata,nrow = 5000,ncol = 100) parallel.a=function(i) { kmeans(mydata,3,n

    0热度

    1回答

    我在R中使用简单kmeans聚类单个向量。由于簇号相当随意分配(我假设),因此我需要按顺序获取它们(使用簇中心)。 这里是一个〔实施例: > vals <- c(0.22, 0.17, 0.21, 0.13, 0.00) > set.seed(32833) > cl <- kmeans(vals ,3) > cl$cluster [1] 2 3 2 3 1 > cl$centers

    2热度

    1回答

    首先,我想弄清楚如何应用这个算法来解决作业项目。所以,我不是在寻找作业解决方案,只是帮助完成我的算法来解决问题。 我想使用K均值聚类来聚集大集(2^6)数组。这些数组是序列[0,1,2 ... 31]的唯一排列。但是,我不需要使用欧式距离,而需要使用反演距离。 我在k-means中的第一步是从数据集中选择k = 10个随机点。然后我计算数据集中每个值到每个随机k点的反转距离。这给出了最初的聚类。

    0热度

    1回答

    我有一个尺寸为128x128的图像。我已经应用matlab的imread功能, A = imread(first.jpg); 但是,这是返回给我一个三维数组128x128x3,我如何将它转换为由3列R,G,B(每种颜色一列)组成的2-D矩阵?

    0热度

    1回答

    我是比较新的R.我只是试图找出集群的最佳数目使用以下方法虹膜数据: library(datasets) head(iris) # method1: wss <- (nrow(iris)-1)*sum(apply(iris,2,var)) for (i in 2:3) wss[i] <- sum(kmeans(iris, centers=i)$withinss) pl

    -1热度

    1回答

    我有一个客户列表(比如说300) - 和一个服务工程师列表(比如lat,long) 。我需要以最佳方式为每位客户指派一名服务工程师。减少出差,增加参加顾客的能力。假设他必须定期参加所有客户。 尝试K意味着集群,它应该将客户划分为10个集群并为每个客户分配服务工程师。任何暗示是赞赏。

    -3热度

    2回答

    我在Matlab中编程K均值算法时遇到了问题。为什么K-means算法不适合对细长数据集进行分类?

    -8热度

    1回答

    我探索虹膜数据中的R设置,我想在以下两个代码一些澄清:使用所述数据的所有情况下 cluster_iris<-kmeans(iris[,1:4], centers=3) iris$ClusterM <- as.factor(cluster_iris$cluster) 我认为第一个正在执行的k-means聚类分析文件,并且只有前3列有3个选择的列。 但是我不确定第二段代码在做什么?第一个是说明

    1热度

    1回答

    我将数据表示为单个变量的许多不同直方图。我想确定使用无监督聚类的哪些直方图是相似的。我也想知道使用的最佳群集数量。 我已阅读Earth Movers Distance度量作为度量直方图之间距离的度量,但不知道如何在通用聚类算法中使用该距离度量(例如,k均值)。 主要:我用什么r软件包和函数来聚合直方图? 中学:如何确定“最佳”数量的聚类? 实施例数据集1(3单峰簇): v1 <- rnorm(n=