我正要做1000维特征向量的聚类。 即特征向量如下所示。 a = {255,2334,436,...,5284}; b = {235,434,63,...,844}; ... 我也有测量2个特征向量之间距离的度量。 但我不能找出哪个聚类算法聚类与此特征向量最好,因为我无法想象这些向量由于高维分布。 任何人都知道可以将这些分布, 或不知道数据分布的条件可视化的方法,如何选择最佳聚类算法? 在此先感谢。如何选择合适的聚类算法
0
A
回答
1
您应该将标记的数据分成训练集和测试集。使用训练集您可以训练一个分类器,您可以使用您的标记测试集来测量性能。
作为分类器,first try可以是SVC。
为了获得更好的可靠性,您应该针对不同的训练和测试集重做此过程。这被称为cross-validation。
+0
+1链接到scikit-learn流程图。我甚至不知道我在找那个东西。 – mtrw
+0
我知道这件事。但是如果有任何算法超越我在交叉验证实验中获得的最佳算法呢?它可能是因为我无法在交叉验证中测试所有算法。所以我想要可视化分布或者如何从标记数据和距离度量标准中找到合适的算法,以确保得到的结果是合理的。 – user2668204
相关问题
- 1. 哪种聚类算法最适合聚类一维特征?
- 2. 如何选择聚合根
- 3. 选择最适合的分类器算法
- 4. 如何选择合适数量的客户进行聚类分析?
- 5. 如何选择分层凝聚聚类的联动方法?
- 6. 带曲线拟合的聚类算法
- 7. 为潜在语义分析选择适当的聚类方法
- 8. PostgreSQL:如何选择非聚合列?
- 9. 如何导入文本文件以适应此聚类算法?
- 10. 特征选择,聚类,降维算法之间的区别
- 11. 在MapReduce中结合聚类算法
- 12. 如何评价我的聚类算法
- 13. 选择合适的Zend Framework异常类
- 14. 如何在适合屏幕的extjs中适合多选择器
- 15. 如何计算coredata(聚合)?
- 16. 选择与聚合函数
- 17. 聚合物和jQuery选择
- 18. DDD:选择聚合根
- 19. DDD选择聚合根
- 20. PostgreSQL选择和聚合
- 21. phpexcel适合选择
- 22. 用于在KMeans聚类中选择合适数量的聚类的剪影索引
- 23. 如何选择算法?
- 24. 如何从类中选择文本以适合div的使用?
- 25. 需要一个更适合我的聚类算法的应用程序
- 26. 映射的聚类算法
- 27. TSP的聚类算法
- 28. 强大的聚类算法
- 29. 逆向概率选择(进化算法的逆适应选择)
- 30. 选择合适的框架
你有什么样的数据?标记的,未标记的?你对班级数量有什么了解吗? – PureW
为此,我收集了实验数据,所以我知道实验数据中的类和标签的数量。然后,我将各种聚类算法应用于数据并评估性能,以便我可以得到最好的方法。但是这个实验数据还不够,也不是一般的,所以实验步骤选择的方法在一般大数据的实际情况下可能会失败,所以我想知道如何得到最适合一般数据的算法,谢谢为你的关怀 – user2668204
如果你已经标记了数据,为什么不只是比较几种不同的聚类算法,并比较哪一个是最正确的呢? – PureW