0
我正在使用hadoop map和reduce program。我需要读取多个文件,并输出到多个文件hadoop mapreduce流式传输中的多文件输出
例
Input \ one.txt
two.txt
three.txt
Output \
one_out.txt
two_out.txt
我需要一些这样的事。我怎样才能做到这一点。
请帮我
感谢
您无法控制由MR生成的文件的名称。但是,如果使用文件输入格式,则每个文件都将传递给另一个映射器,最终创建单独的输出文件,除非该文件相当大。 –
@AnkurShanbhag - 好的。命名无关紧要我需要为每个I/P文件分别提供一个o/p文件 – Backtrack