我有以下XML结构: -Marklogic:独特单词数
<Root>
<text>
Marklogic is a good big data tool. Right now I am exploring Marklogic.
</text>
</Root>
现在我想算的唯一字(如Marklogic- 2倍,BIG-1时,数据-1时间等的发生)。我通过使用fn:count()
来实现此目的,但在数据库较大的情况下,fn:count()
太慢。
是否有任何其他优化的方式来实现这一目标? (与索引相关的东西)
http://stackoverflow.com/questions/25403223/counting-all-unique-words-in-an-unstructured-document-using-index-data –