我是hadoop和mapreduce的新手。我在hadoop Mapreduce中运行数据时遇到问题。我想要以毫秒为单位给出结果。有什么方法可以在毫秒内执行我的Mapreduce作业吗? 如果不是,那么hadoop mapreduce在完全分布式多群集(5-6个节点)中可以采用的最短时间是多少。 要在hadoop mapreduce中分析的文件大小约为50-100Mb 程序是用Pig.Any suggesstions编写的?MapReduce作业所花费的时间
-1
A
回答
0
这是不可能的(afaik)。 hadoop并不意味着实时的东西。它最适合批量作业。 mapreduce框架需要一些时间来接受和设置工作,这是你无法避免的。我不认为这是一个明智的决定,让超高端机器建立一个hadoop集群。另外,框架在实际开始工作之前还必须做一些事情,比如创建数据的逻辑分割。
+0
感谢您的建议。 – 2013-03-22 04:15:18
1
用于即时查询数据使用Imapala,Apache Drill(WIP)。演习根据Google Dremel。
Hive作业被转换成MapReduce,因此Hive也是批处理方式,而不是实时的。尽管如此,许多工作正在改进Hive的性能(1和2)。
相关问题
- 1. 总共花费的时间和所有线程所花费的平均时间
- 2. 加载uiscrollview所花费的时间
- 3. 计算仅在工作时间内日期之间所花费的时间
- 4. 花费file_get_contents的时间
- 5. 花费的实际时间
- 6. 使用System.currentTimeMillis所花费的时间在android上不能工作
- 7. 执行Hadoop作业所耗费的时间
- 8. MagicalRecord节省花费时间
- 9. MDX查询花费时间
- 10. sqlite3需要花费时间
- 11. WebRequest.GetResponse()花费太多时间
- 12. :app:transformClassesAndResourcesWithProguardForRelease花费太长时间
- 13. Selenium webdriver find_element_by_xpath花费时间
- 14. 在json中花费时间
- 15. ViewResult.ExecuteResult花费太长时间
- 16. GraphAlgoFactory.allSimplePaths花费很多时间
- 17. 当hystrix超时时,如何打印所花费的时间?
- 18. 执行%/ * + - 操作所花的时间
- 19. 如何计算java中的服务所花费的总时间?
- 20. 剖析MapReduce作业
- 21. HbaseTestingUtility和MapReduce作业
- 22. Mapreduce - 序列作业?
- 23. SecondaryNamenode和MapReduce作业
- 24. 多个MapReduce作业
- 25. Python:如何衡量等待I/O所花费的时间?
- 26. AS 2.0和gradle 2.0第一次运行所花费的时间
- 27. 查找一天中所有花费时间的总和
- 28. 使用C#在asp.net中处理请求所花费的时间
- 29. 测量API调用所花费的时间
- 30. 如何记录jdbc组件所花费的时间
得到一个真的非常非常快的电脑。 – 2013-03-21 19:15:30
感谢您的建议。 – 2013-03-22 04:15:47