有没有办法输出来记录MapReduce作业的中间(Map Phase)输出而不编辑应用程序? (该应用程序不是我的,但集群是,并且我可以根据需要设置Hadoop集群)Hadoop MapReduce中间输出
回答
keep.task.files.pattern参数可用于保留中间文件。一旦作业完成,中间文件必须手动清理。因为这是一个map/reduce任务属性,所以必须在配置文件中设置它,并再次打包jar文件。
请你详细说明一下吗?我已经设置了这个参数,并且在输出目录以及mapred本地缓存中的任何地方都进行了搜索,但没有任何地图阶段输出... – ihadanny
...我对$ {mapred.output.dir }/_暂时的,但我能找到的所有文件夹都是“_attempt_local_0003_r_000000”文件夹,从来没有与其对应的“m”文件夹 – ihadanny
我在'mapred'中将'keep.task.files.pattern'设置为'。* 00000. *' -site.xml“和'core-site.xml'中,参数'hadoop.tmp.dir'设置为'$ HADOOP_HOME \ tmp'。执行作业后,file.out和file.out.index位于'$ HADOOP_HOME/tmp/mapred/local/taskTracker/praveensripati/jobcache/job_201111031937_0001/attempt_201111031937_0001_m_000001_0/output'文件夹中。这些文件是SequenceFile格式。 [Here](http://goo.gl/7fJzT)是读取序列文件的示例代码。你使用了什么样的模式? –
- 1. Hadoop MapReduce不写输出
- 2. Hadoop HDFS MapReduce输出到MongoDb
- 3. Hadoop - MapReduce - Mapper输出类型
- 4. 在Hadoop中向Cassandra输出一行Mapreduce
- 5. hadoop mapreduce中单独的输出文件
- 6. Hadoop,MapReduce - 多输入/输出路径
- 7. Hadoop MapReduce多输入
- 8. hadoop mapreduce流式传输中的多文件输出
- 9. Hadoop中的MapReduce
- 10. 将Hadoop Mapreduce输出到本地磁盘或标准输出
- 11. hadoop mapreduce
- 12. Hadoop中的Mapreduce程序中的意外输出
- 13. mapreduce中的reducers hadoop
- 14. Hadoop MapReduce中的DataJoins
- 15. Hadoop MapReduce - 每个输入的一个输出文件
- 16. 如何将hadoop mapreduce的输出作为restful api的输入?
- 17. Java MapReduce:如何在Hadoop输出中存储LONG列表
- 18. 从Hadoop中的映射器生成多个输出文件MapReduce
- 19. 如何格式化Mapreduce在Hadoop中写入的输出
- 20. Hadoop Mapreduce wordcount
- 21. Hadoop mapreduce编程
- 22. hadoop mapreduce model java
- 23. Hadoop和MapReduce
- 24. hadoop mapreduce teragen FAIL_CONTAINER_CLEANUP
- 25. hadoop mapreduce两种
- 26. 在hadoop mapreduce
- 27. hadoop的Dumbo mapreduce
- 28. Hadoop Mapreduce ClassNotFoundException
- 29. Hadoop MapReduce思维
- 30. hadoop-mapreduce reducer-组合器输入
你能重新配置工作吗? –