我在Python(scikit-learn)中使用K-Means对文本数据进行聚类。 如何获取该行所属的集群?K-means文本数据聚类:获取文本所属的集群
例: 数据=“红,黄,蓝的颜色”,“冰淇淋是我最喜爱的食物”,“你现在可以得到草莓味太冰淇淋”,“天空是蓝色的”]
在用n_clusters = 2执行K-Means之后,我预计会形成两个集群st
“红色,黄色和蓝色是颜色”,“天蓝色”在一个群集中,“冰淇淋是我最喜欢的食物”,“你现在可以得到草莓味道的冰淇淋”。
我该如何得知这一点,即哪一行在哪个簇?
代码K-手段:
vectorizer = TfidfVectorizer(stop_words='english')
X = vectorizer.fit_transform(data)
model = KMeans(n_clusters=true_k, init='k-means++', max_iter=500, n_init=20)
model.fit(X)