2012-06-28 89 views
2

我正在尝试按照Mahout In Action书中所述在路透社数据上使用LDA的示例。但是,无论我运行多少次,我总是只能得到一个主题。LDA Mahout只有一个主题

我跑的命令指示:

mahout lda -i reuters-vectors/tf-vectors -o reuters-lda-sparse -k 10 -v 34262 -x 20 -ow 

我从运行seqdumper拿到了号。命令运行后,我运行LDAPrintTopics在书中指出,并得到如下:

Topic 0 
=========== 
billion [p(billion|topic_0) = 0.04580929884162013 
pct [p(pct|topic_0) = 0.043323700764985575 
dlrs [p(dlrs|topic_0) = 0.031395871939373196 
3 [p(3|topic_0) = 0.027311386657272094 
1987 [p(1987|topic_0) = 0.025690077982656934 
1 [p(1|topic_0) = 0.022727304049111215 
reuter [p(reuter|topic_0) = 0.019572283708227903 
mln [p(mln|topic_0) = 0.014569551610736616 
april [p(april|topic_0) = 0.014453636611524965 
march [p(march|topic_0) = 0.014359948846622552 

有没有办法让更多的话题了LDA的?

谢谢。

回答