10
A
回答
12
这个想法是迭代地将你的云点分成两部分。换句话说,您将构建一个随机二叉树,其中每个分裂(具有两个子项的节点)对应于将云中的点分割为2.
您从点云开始。
计算其矩心(重心)瓦特
选择云
的点中随机CL的点相比瓦特时构建点Cr作为CL的对称点(分段CL-> w是相同W-> CR)
独立的两个云点,那些最接近为Cr属于subcloud R,和那些最接近CL属于subcloud L
重申,subclouds R和L
注:
可以丢弃随机点一旦你使用它们。但是,保持所有子模块的质心。
当你的子云包含正好一个点时停止。
如果您想要k个群集,只需取k个质心,使其包含初始云的所有点。如果你愿意,你可以做更多更复杂的事情(最小化云的变化等)。假设你想要4个集群(为了方便起见,两个幂)然后你只需要将你的云切成两半,然后切割每个集群在两个subclouds。如果你想要8个簇,那么再次将这些子云分成两份。再次为16个集群。
如果你想K个K的集群不是2的幂(比方说24),那么看看最接近的二个幂。现在是16个。你还缺少8个集群。每个“level-16-cluster”是“level-16-subcloud”的质心。你要做的是取8个“16级集群”(例如随机),并将它们分别替换为两个“子级”“32级集群”。 (这两个孩子的“32级集群”对应于两个“级别-32-subcloud”,加起来就是父级“level-16-subcloud”)
相关问题
- 1. Leader聚类算法解释
- 2. 平分文档聚类的KMeans
- 3. 计算Kmeans聚类的误差
- 4. 如何使用kmeans聚类解释更高百分比的点变异?
- 5. 使用scipy kmeans进行聚类分析
- 6. 聚类算法的功能缩放(规范化)(如Kmeans&EM)
- 7. 如何格式化Spark Spark kmeans聚类算法的数据?
- 8. 聚类基线比较,KMeans
- 9. 解释聚类指标
- 10. 数字聚类/分区算法
- 11. 聚类视觉可分簇的算法
- 12. 聚类算法的性能分析
- 13. 如何计算kmeans在tfidf矩阵中解释的方差?
- 14. 聚类标签和聚类中心(R中的kmeans)
- 15. 使用mahout进行Kmeans聚类
- 16. Kmeans聚类识别R中的知识
- 17. Kmeans聚类和文本挖掘在R
- 18. KMEANS文本数据进行聚类
- 19. kmeans聚类与数据框(scipy)
- 20. 将kmeans聚类结果导出到.csv
- 21. Kmeans聚类如何在tensorflow中工作?
- 22. opencv kmeans聚类的输入矩阵
- 23. R绘制kmeans与热图聚类
- 24. CLAHE算法解释
- 25. Kruskal算法解释
- 26. FASTA算法解释
- 27. 如何解决这与kmeans聚类和使用余弦similiraty
- 28. KMeans中的数据聚类使用二叉树结构的算法
- 29. 如何分类但不使用分类或聚类算法?
- 30. KMeans算法在opencv中
感谢您的回答,现在更加清晰。但是我有两件事我不明白 - “在云的点之间随机选择一个点” - 意味着我需要选择一个随机向量? 第二件事 - 我不明白我需要为K群集做什么? – Nir
那么,你有一堆你想要聚类的点,对吧?在云中选择一个点意味着......在云中选择一个点=)我不完全明白你的意思是随机矢量......在云中选择点,而不是在整个空间中随机选择。我已经更新了K簇的帖子 – Fezvez
我猜矢量mean point =]但是如果我的随机选择不好,并导致不均匀分裂簇呢?我虽然在做:我会选择拥有最大SSE的集群 - 你认为什么? – Nir