我打算为kmeans聚类使用orange。我已经阅读了教程,但我仍然有几个问题想要问:Python KMeans橙色框架
我正在处理高维向量上的聚类问题。 1)是否实现了余弦距离? 2)我不想给空值赋零。我试过在空字段中没有任何零,并且出现错误:
SystemError: 'orange.TabDelimExampleGenerator': the number of attribute types does not match the number of attributes
如何指示空值? 3)有没有一种方法可以将“ID”合并到示例表中?我想用一个ID(不分类)标记我的数据以便于参考。我不会将ID列作为我的数据的官方部分。
4)kmeans聚类有没有办法输出不同的方法? 我更喜欢这种格式的东西:
cluster1: [ <id1>, <id2>, ...]
cluster2: [ <id3>, ... ]
rather than just [1, 2, 3,1 , 2, ... ]
谢谢!