2016-11-23 41 views
0

我使用Lucene 5.3.1,并且我已经编制了一些文档的索引,现在我试图找到一个内置函数来计算所有标记计数(跨集合/ index)如何计算集合/索引中的所有标记数

我知道我可以迭代所有文档并对其长度进行求和。但是由于我的复杂算法增加了运行时间,我试图避免这种方法。我认为lucene可能有一个API ...

毕竟,我GOOGLE了这个功能(或任何类似的功能),但我找不到任何有用的链接。

现在的问题是:是否有任何内置函数返回集合中的所有枚举数(即整个索引)?如果没有,是否还有其他最佳方法?

任何帮助表示赞赏,谢谢。

回答

1

最终我找到了解决方案。

我以下列方式使用CollectionStatistics

CollectionStatistics collectionStats = indexSearcher.collectionStatistics("Body"); 
long token_count = collectionStats.sumTotalTermFreq(); 

sumTotalTermFreq()方法集合中返回的所有标记。它适用于任何查询。

相关问题