k-means

    0热度

    1回答

    我想在Spark中使用MongoDB提供的数据运行k-means。 我有一个工作实施例中,其作用对一个平面文件: sc = SparkContext(appName="KMeansExample") # SparkContext data = sc.textFile("/home/mhoeller/kmeans_data.txt") parsedData = data.map(lambda l

    0热度

    1回答

    我知道有这样的问题和一些解决方案,但我希望有另一种方法。 目标:最终目标是聚集给定图像的颜色,然后允许用户更改这些颜色。用户不需要输入任何k。该算法确定K。 方法:目前,我正在使用侧影评分指标(http://scikit-learn.sourceforge.net/dev/modules/generated/sklearn.metrics.silhouette_score.html#sklearn

    0热度

    2回答

    当我在下面的代码中使用时,我看到在总平方中的总数增加。这甚至可能,或者我在代码中犯了一些错误? v<-foreach(i = 1:30,.combine = c) %dopar% { iter <- kmeans (clustering_data,centers = i,iter.max = 1000) iter$tot.withinss }

    2热度

    1回答

    您好,我发现这个教程关于 http://www.mathworks.com/help/images/examples/color-based-segmentation-using-k-means-clustering.html 从图像分割颜色有有一个部分,其中的颜色已被分割为3部分 具体地,代码 for k = 1:nColors color = he; color(rgb_l

    -3热度

    1回答

    我有以下输入整数向量(例如): 4 138 233 461 610 621 669 742 814 827 89 138 334 656 697 810 138 138 196 738 659 738 4 461 138 337 756 810 8 138 196 337 468 663 664 756 809 810 它们都包含整数值[1-850]和都存储在CSV文件。 我想根

    -1热度

    1回答

    我读到平分k均值算法有助于收敛到全局最小值。我不确定这是否正确,因为我无法找到批准此声明的来源或研究论文。有人可以分辨这种说法是否正确?

    0热度

    2回答

    我应用k-means算法分割图像。我使用内置的k-means函数。它工作正常,但我想知道的阈值,将其转换为K均值方法的二进制图像。例如,我们可以通过使用内置的功能的MATLAB得到阈值: threshold=graythresh(grayscaledImage); a=im2bw(a,threshold); %Applying k-means.... imdata=reshape(grays

    -2热度

    1回答

    我给了一个群集。我如何决定将两个部分的群集分解比原始群集好? 我已经尝试使用K均值与k = 2,并再次卡住..溢出或不溢出更好? 编辑:嗯,我不明白的downvotes ...一点解释将有助于改善这样的问题:d

    1热度

    1回答

    我试图把这种其中: n <- NROW(train) s <-which(train$cl[-n] == state) 我知道,这只是一个比较,所以我相信熊猫我可能只是这样做: n = train.count() s = train['-n'] == state 我真的不知道如何将R中的cl翻译成熊猫 谢谢!

    0热度

    2回答

    我正在处理一组坐标,并且想要动态地(我有很多组需要经过这个过程)了解数据中有多少个不同的组。我的方法是应用k-means来调查它是否会找到质心,我可以从那里去。 当使用6个不同的聚类(直观地)绘制某些数据时,k-means算法继续忽略两个重要的聚类,同时将多个质心置入另一个。 见图像下面: 红是坐标数据点和蓝色是质心的是k均值提供。在这个特定情况下,我已经达到了15个(任意),但它仍然不能识别右侧