2013-10-27 65 views
2

我一直在使用Gensim试验LDA主题建模。我似乎无法在Gensim中找到任何主题模型评估工具,它可以报告关于评估文本的主题模型的困惑,从而有助于随后对LDA参数(例如主题数量)进行微调。如果有人能够阐明我如何在Gensim中进行主题模型评估,我们将不胜感激。这个问题也被张贴在metaoptimize上。Gensim中的主题模型评估

回答

1

gensim mailing list上找到了answer

简而言之,LdaModel的bound()方法基于伸出的语料库计算困惑度的下限。

+5

从gensim 0.8.9开始,你也可以使用'model.log_perplexity(holdout)',这是一个方便的包装器。 – Radim