我仍在研究评估使用聚类(无监督学习)形成的聚类?如何评估群集?
我试着用搜索引擎,但我得到的措施过于理论化。如果人们可以分享他们正在使用的机制来评估形成的集群,那将是非常好的。假设我有一个Java集群,以便包含Java EE,Java ME,RMI,JVM等,另一个集群表示NoSQL,并且将包含Neo4j,OrientDB,CouchDB等。这是完美的,我的聚类算法给了我最多准确的群集。
但是经过培训和测试后,我可能会说NoSQL集群下的MySQL,Oracle,所以我只是做一个手动/视觉解释,然后重新训练我的算法或调整它,以便我得到更好的聚类。
现在我想自动执行这个手动可视化集群的过程,并有一个系统给我准确的集群形成。我正在寻找类似于搜索中使用的Precision,Recall,NDCG,Map等的东西。我的聚类长度不同,可能会形成n个不同的聚类,因此精度/回忆并不是正确的。
感谢您提供此信息。你的文章绝对有用。 – Yavar 2012-02-02 17:13:13
希望它有帮助!我很期待知道这个项目是如何结束的 – 2012-02-03 16:56:29