0
我想聚集一些文本文档以找到具有相同概念的文档。我已经使用潜在语义分析(LSA)完成了语义相似性,但我混淆了我应该为我的目的选择哪种聚类方法。 谢谢为潜在语义分析选择适当的聚类方法
我想聚集一些文本文档以找到具有相同概念的文档。我已经使用潜在语义分析(LSA)完成了语义相似性,但我混淆了我应该为我的目的选择哪种聚类方法。 谢谢为潜在语义分析选择适当的聚类方法
您可以使用层次聚类。 R中有一个名为RClusterpp的包,它对大数据的分层聚类非常有效(它执行并行计算)。然后,您可以在可能范围内为树状结构树切割不同数量的簇,并使用交叉表检查簇配置文件。