2016-01-08 20 views
0

我已经在scikit中实现了k-means算法。所以,我已经把历史文件聚集起来了。现在,我想确定一个新的文档集群。 如何确定新文档的集群?用Scikit确定新文档的集群

回答

2

假设你使用内置的分类:

km = KMeans() 
km.fit(X) 

如果你有X_new_sample用相同的矢量格式X,您可以使用predict()来识别集群中的每个X_new_sample行所属。

km.predict(X_new_sample)