用Scikit确定新文档的集群

我已经在scikit中实现了k-means算法。所以，我已经把历史文件聚集起来了。现在，我想确定一个新的文档集群。如何确定新文档的集群？用Scikit确定新文档的集群

2016-01-08 amee

假设你使用内置的分类：

km = KMeans() 
km.fit(X)

如果你有X_new_sample用相同的矢量格式X，您可以使用predict()来识别集群中的每个X_new_sample行所属。

km.predict(X_new_sample)

2016-01-08 06:35:13

回答