0
我已经在scikit中实现了k-means算法。所以,我已经把历史文件聚集起来了。现在,我想确定一个新的文档集群。 如何确定新文档的集群?用Scikit确定新文档的集群
我已经在scikit中实现了k-means算法。所以,我已经把历史文件聚集起来了。现在,我想确定一个新的文档集群。 如何确定新文档的集群?用Scikit确定新文档的集群
假设你使用内置的分类:
km = KMeans()
km.fit(X)
如果你有X_new_sample
用相同的矢量格式X
,您可以使用predict()
来识别集群中的每个X_new_sample
行所属。
km.predict(X_new_sample)