3

很容易理解如何使用map-reduce来收集文本并构建大型倒排索引。但是如何将map-reduce用于倒排索引搜索呢?如何在倒排索引搜索中使用map-reduce?

+0

你是基于什么问题?我的意思是,你怎么知道它被用于搜索? AFAIK,搜索通常是单线程的,并且相对便宜。虽然,我可能是错的......:| – amit

+0

我认为标签“算法”和“信息检索”更好,所以我重申了。如果你认为我错了 - 回滚或重新编辑。 – amit

+0

通过mapreduce构建索引的概念很容易理解。但是基于我的搜索,真的很难找到一些很好的参考来教导人们如何去做。我听说Solr支持mapreduce构建索引,但没有文档或代码显示它。我正在努力实现这一点,你能否提供一些关于如何实现它的参考? – hakunami

回答

4

建立一个大的倒排索引,没错。但不适合搜索。 MapReduce是批处理。

我很确定你不想等到MapReduce作业在2 mio上运行。项目并对它们进行评分,然后再有一个Job需要运行并对分数进行降序排序。

但这只是Hadoop的情况。也许如果你在MongoDB中使用MapReduce,这可能是准确的。但仍有很多开销。

0

据我所知,MapReduce主要用于批处理,而不是搜索,这对响应时间有较高的要求。