我正在使用TestDFSIO和TeraSort基准测试工具进行多个Hadoop测试。我基本上用不同数量的datanodes进行测试,以评估处理能力和数据节点可伸缩性的线性。Hadoop在重新启动时删除MapReduce历史记录
在上述过程中,我显然必须重启几次所有的Hadoop环境。每次我重新启动Hadoop时,所有MapReduce作业都将被删除,作业计数器将再次从“job_2013 * _0001”开始。出于比较的原因,保持我之前启动的所有MapReduce作业对我来说非常重要。所以,我的问题是:
¿如何避免Hadoop在重新启动后删除所有MapReduce作业历史记录? ¿Hadoop环境重新启动后是否有某些属性可以控制作业的删除?
谢谢!
谢谢Zhutoulala的回答中发现。我虽然有任何机构会给我一个答案。我会测试你的建议! – VikBar