Q
文档聚类
-2
A
回答
5
The Wikipedia article on document clustering包括链接从弗吉尼亚理工大学2007年的论文由尼古拉斯·安德鲁斯和爱德华·福克斯称为“Recent Developments in Document Clustering”。我不确定具体是什么你会被称为“人工智能算法”,但扫描论文的内容表明他们看向量空间模型,kmeans的扩展,生成算法,谱聚类,降维,基于相位的模型和对比分析。这是一个相当数学上密集的处理,但他们很小心地引用他们谈论的算法。
2
聚类确实是AI域中的一类问题。如果你想降低一级,你可以说它在机器学习领域。从这个意义上讲,AI不会改进文档聚类,但可以解决它! Dumbledad mentions一些基本的选择,但你每次的数据类型可能会更好地用不同的算法处理。这个问题有很多基于k-means的方法。在这种情况下需要仔细播种。球形k-均值(搜索Dhillon的论文)是一种简单而标准的方法。其他扩展名是k-synthetic prototypes。
子空间聚类也是一个很好的尝试,一般来说,如果您想要比“文档聚类”文献检查“高维和稀疏数据空间中的聚类”更进一步。
相关问题
- 1. 按时间聚类文档
- 2. 文档聚类/分类中的功能?
- 3. 在Python中对文档进行聚类
- 4. 不同文档类型的聚合
- 5. Python的K均值对文档聚类
- 6. 文档聚类的似然相似性
- 7. 文档聚类和可视化
- 8. Objective-C中的文档聚类
- 9. 文档聚类基础知识
- 10. 平分文档聚类的KMeans
- 11. 聚集组嵌套文档
- 12. 将概念上类似的文档聚类在一起?
- 13. 文本聚类
- 14. 基于PSO和K-means的文本文档聚类R
- 15. 聚合物:使用App-IndexedDB的镜与聚合物文档应用-pouchdb文档
- 16. Bigquery - 文本聚类
- 17. 使用K-means算法进行文档聚类
- 18. 要聚类的文档的最大限制
- 19. K-means文档聚类 - 下一步是什么?
- 20. 文档聚类的第一步的选项
- 21. RavenDB将文档映射加载到POCO或域聚合根类?
- 22. 聚类和kmeans有不清楚的文档
- 23. 聚类超过3个文档时Kmeans进行异常缓慢
- 24. 什么是使用elasticsearch做文档聚类的便捷方式?
- 25. Mongodb聚合从文档内部检索文档
- 26. 合并子文档主文档与MongoDB的聚集
- 27. 文本文件聚类
- 28. 检索文档频率与聚合
- 29. 德尔福 - 保持Word文档聚焦
- 30. elasticsearch中子文档的子聚合?