嗨,我有一个Map Reduce任务,说AverageScoreCalculator有mapper和reducer。 问题是我静态初始化AverageScoreCalculator中的几个字段对于mapper和reducer都是可用的吗?Map和Reduce是否在单独的JVM中运行?
2
A
回答
2
默认情况下,每个映射和reduce任务都运行在不同的JVM中,并且可以有多个JVM在节点上的任何特定实例上运行。
设置下列属性
mapred.job.reuse.jvm.num.tasks = -1
mapreduce.tasktracker.map.tasks.maximum = 1个
mapreduce.tasktracker.reduce.tasks 。最大= 1
mapreduce.job.reduce.slowstart.completedmaps = 1
和将只有一个单一的映射器/用JVM重用给定的节点上运行的减速机和减速器将不会启动,直到所有该映射器已完成处理。
几件事情要注意
以上方法适用于MapReduce的1X释放,是不是一种有效的方法。
MapReduce 2x版本不支持JVM重用。
0
你应该先知道你的工作是要在被运行的配置/模式。
举例来说,如果你在本地(独立)模式下运行,将只有一个JVM上运行你的工作。 如果您以伪分布模式运行它,则将使用您计算机上的多个JVM运行作业。 如果以分布模式运行它们,它们将运行在不同的机器上,当然还有不同的JVM(使用JVM重用)。
1
如果静态字段在map或reduce程序中动态更新,将会产生问题。独立和伪分布式模式适用于初学者,只能在学习Hadoop时使用。这些模式在处理大量数据(这是地图的主要目标 - 减少编程实践)时不会帮助。
当作业分布在节点上时,静态信息将会丢失。重新考虑使用静态变量。
如果可以的话,粘贴地图和减少程序以及需要静态字段,我们可以有相同的更好的解决方案。
相关问题
- 1. 在单独的JVM中运行目标
- 2. 单独的文件VS的Map/Reduce
- 3. 在Map/Reduce中运行MongoDB查询
- 4. Java 8 Map和Reduce不运行
- 5. 问题在cygwin中运行简单的map-reduce hadoop示例
- 6. 是否可以在mongoDB map reduce的map函数中使用node.js?
- 7. getInformation(),Map和Reduce方法在Map/Reduce Script中的用法是什么?
- 8. 我是否在map-reduce进程中丢失了行?
- 9. 在Eclipse中的单独JVM中运行每个JUnit测试?
- 10. BeginInvoke()是否运行单独的线程?
- 11. Maven或Bamboo中是否有一些设置限制测试在与Bamboo相同的JVM中运行,而不是在单独的JVM中运行?
- 12. maven在Windows上的单独JVM中运行测试用例
- 13. 什么是最简单的解释什么是Hadoop和Map/Reduce?
- 14. 的Hadoop MapReduce的不运行0%Map和Reduce
- 15. 在Discodex中存储的数据上运行Disco map-reduce作业
- 16. GWT和Google Eclipse插件:是否可以在单独的JVM中运行服务器?
- 17. 在CouchBase Lite中运行map reduce时出错
- 18. MongoDb v.1.8 +:如何在临时集合中运行Map-Reduce
- 19. 当分区程序在Map Reduce中运行时?
- 20. 在MongoDB中学习Map-Reduce
- 21. 在javascript中使用map reduce
- 22. Google Analytics(分析)是否在单独的线程中运行?
- 23. SQL触发器是否在单独的线程中运行?
- 24. EF嵌套查询是否在单独的线程中运行?
- 25. CallBatchTasks(来自ORMLite)是否在单独的线程中运行?
- 26. Swift CoreBluetooth:CentralManager是否应该在单独的线程中运行?
- 27. Web Audio API事件是否在单独的线程中运行?
- 28. 异步方法是否在单独的线程中运行?
- 29. does getlastknownlocation是否在单独的线程中运行?
- 30. ReportViewer是否在单独的AppDomain中运行?