我已经学习了几个星期的LDA和Topic模型。但由于我的数学能力很差,我无法完全理解它的内部算法。我使用了GibbsLDA实现,输入了很多文档,并设置了题目数为100,我得到了一个名为“final.theta”的文件,其中存储了每个文档中每个主题的主题比例。这个结果是好的,我可以使用主题比例来做很多其他事情。 但是,当我尝试在LDA上Blei的C语言实现时,我只有一个名为final.gamma的文件,但我不知道如何将此文件转换为主题比例样式。 任何人都可以帮助我。 我了解到,LDA模型有很多改进的版本(如CTM,HLDA),如果我能找到类似于LDA的主题模型,我的意思是当我输入大量文档时,它可以直接输出主题比例文档。 非常感谢!LDA和主题模型
Q
LDA和主题模型
4
A
回答
1
我觉得跟Blei执行的问题是,你正在运行做变推论:
$ LDA INF [参数...]
当你想要做的话题估计,与:
$ LDA EST [参数...]
一旦运行,就会出现无论是在当前目录或由可选的最后一个参数指定的目录中的文件“final.beta”。然后运行包含在tar中的python脚本“topics.py”。这里的自述:http://www.cs.princeton.edu/~blei/lda-c/readme.txt描述了这一切,尤其是部分B和D.
(如果这仍然没有任何意义,让我知道)
至于改进,如CTM等:我不知道知道关于HLDA的任何事情,但我过去曾使用过LDA和CTM,我可以说这两者都不比其他更好 - 这是对不同数据更好的一种情况。 CTM假定文档是相关的,并且只要它是真实的,就使用该假设来改进结果。
希望这会有所帮助!
0
要获得E [θ]只是规范化每一行内的gammas。它来自Dirichlet分布的性质。
相关问题
- 1. LDA主题建模 - 培训和测试
- 2. R中的LDA和主题建模 - 主题,单词和概率
- 3. 如何打印lda主题模型和每个主题的文字云
- 4. 主题建模:LDA,词频每个主题和Wordcloud
- 5. R主题建模:lda模型标注功能
- 6. 用于Python中主题建模的LDA
- 7. 如何在gensim中的LDA模型中获得主题编号
- 8. R LDA主题模型如何获得delta的后验
- 9. 如何从gensim打印LDA主题模型? Python
- 10. Mallet中的空主题LDA主题建模
- 11. 了解LDA /主题建模 - 太多的主题重叠
- 12. 用LDA预测主题
- 13. Gensim LDA主题分配
- 14. 如何将R LDA主题模型管道化为主题模型可视化引擎(TMVE)?
- 15. 带火花的LDA模型
- 16. 错误而从LDA模型
- 17. R LDA主题建模:结果主题包含非常相似的词
- 18. LDA/LSI在Gensim中使用预定义主题列表进行主题建模
- 19. 加载计算的LDA模型并打印每个主题最常用的词
- 20. LDA - 为主题分配关键字
- 21. LDA Mahout只有一个主题
- 22. 只有LDA获取主题条款
- 23. 使用Spark LDA可视化主题
- 24. 在Python中命名LDA主题
- 25. 用(LDA,HDP)自动创建主题?
- 26. 为新数据预测LDA主题
- 27. 如何确定LDA的主题数量?
- 28. 标记LDA学习斯坦福主题建模工具箱
- 29. 主题建模与机器学习与LDA
- 30. 推断标记的LDA/pLDA [主题建模工具箱]
+1为LDA参考 - 这是一个新的想法给我。谢谢。 – duffymo 2012-03-07 13:11:59