我想通过使用Jaccard索引(从sklearn.metrics导入jaccard_similarity_score)计算通过使用KMeans生成的集群之间的相似性。这些可能是一个包含特定值的矩阵:在[i,j]应该是群集i和j之间的相似度。我现在代码: from sklearn import datasets
from sklearn.cluster import KMeans
from sk
我正在尝试使用scikit-learn在训练好的k-means模型中预测一群测试文档的集群。 vectorizer = TfidfVectorizer(stop_words='english')
X = vectorizer.fit_transform(train_documents)
k = 10
model = KMeans(n_clusters=k, init='k-means++',