0
A
回答
2
MapReduce用于处理。因此,一旦处理完数据并生成了HDFS上的聚合信息,您将不得不在某些程序中读取文件以显示给用户。或者有几个备选选项可用于从HDFS中读取数据: 您可以使用Hive并在此数据之上创建一个表并使用SQL查询来读取数据。一个简单的Web应用程序可以使用向配置单元提供JDBC接口的thrift服务器连接到此应用程序。 其他选项包括将数据加载到HBase,Shark等全部取决于你的用例是汇总数据的大小的interms,性能要求
1
你在MapReduce之后构建的是一个倒排索引,一个很好的小数据结构体。现在你必须使用它。
例如,在谷歌的情况下,这个倒排索引在许多服务器上被分割,并将整个列表存储在每个服务器上。因此,例如,服务器500具有要使用的列表,而另一个具有待使用的列表。这些是实现细节,如果可以将索引保存在内存中,理论上可以将它存储在一个大散列中的一个框中。
当客户在发动机中输入文字时。它将检索整个列表。如果有多个单词,它将做这些列表的交集,以显示具有这两个单词的文档。
这里是他们是如何做http://infolab.stanford.edu/~backrub/google.html
参见“图4.谷歌查询评估”
相关问题
- 1. 如何从TFS中的文本文件生成文档输出
- 2. 如何从Weka文本分类中输出生成的文档
- 3. 是否可以为map-reduce生成多个输出文件?
- 4. nifi如何生成文档?
- 5. 如何生成API文档
- 6. 如何生成API文档
- 7. 如何生成ThreeJS文档
- 8. Waf:如何输出生成的文件?
- 9. MS Word文档文件生成索引
- 10. 如何在猫鼬中检索文档
- 11. 如何在YUIDoc生成的文档
- 12. Qt静态库在生成后不输出任何文件
- 13. 如何在重新安装后使用rvm生成文档?
- 14. 如何在由http请求生成的输出中搜索
- 15. 如何在MATLAB中生成ANFIS输出?
- 16. 在PHP中如何检索mongoDB文档的文档内容?
- 17. 如何从css文件生成文档?
- 18. 如何在python上生成一个word文档生成器?
- 19. Sphinx/reST未生成文档索引
- 20. 如何在Tensorflow中生成特殊输出字后停止RNN?
- 21. Amazon Elastic Map Reduce:作业流失败,因为输出文件尚未生成
- 22. 生成输出
- 23. 生成文档,然后用php压缩
- 24. 如何在documentum中检出文档时从文档
- 25. 如何在Xcode中检索/生成Perfect的PerfectLib.framework文件?
- 26. Python:生成基于Docstring的HTML输出文档
- 27. 规划文档生成项目;寻找输出格式建议
- 28. 如何检索由JavaScript生成的HTML
- 29. 生成EXCEL文件输出在Java中
- 30. Mongodb检索文档
你的问题是不是夹板请详细说明为全文的源 – Jijo