我目前使用MongoDB的全文搜索功能来计算每小时包含某个关键字的文档数量。MongoDB全文搜索和聚合管道
当在每个文档都是Tweet的大集合中运行时,这非常有趣。例如,关键字“谢谢”我们会在11月29日看到(Thanks Giving)。
我目前的做法作品(它产生的上述地块),但它不会扩展。目前,我通过迭代搜索返回的文档来手动计算每小时的推文数量。这种方法不会扩展,因为此搜索结果最终将达到MongoDB文档限制。目前它的工作原理是因为我只有350万条推文,但我计划收集更多。
data = db.command('text', collection,
search=query,
project={'hour_bucket': 1, '_id': 0},
limit=-1
)
hours = Counter()
for d in data['results']:
hours[d['obj']['hour_bucket']] += 1
我的问题是:文本搜索可以在聚合管道内使用吗?这将解决我所有的问题。然而,我看到的唯一的评论如下:https://jira.mongodb.org/browse/SERVER-9063
有没有人知道这项工作的状态是什么?