6
当我设置fileinputFormat作为hadoop输入。 arg[0]+"/*/*/*"
表示不匹配任何文件。可以hadoop从多个目录和文件采取输入
什么,我想是从多个文件为已读:
Directory1 ---Directory11 ---Directory111 --f1.txt --f2.txt ---Directory12 Directory2 ---Directory21
是否有可能在Hadoop中? 谢谢!
所以它会从一个文件夹中的多个文件夹读取并递归地读取每个子文件夹中的许多文件? – JudyJiang 2013-05-08 16:52:46
我错了,并更新了我的答案以反映这一点。我猜你的“arg [0]”是错误的。你从哪里使用?如果它的命令行可能需要$ arg [0],如果它来自代码,则应该使用multipleinputs方法 – greedybuddha 2013-05-08 17:07:32
它在我的java代码中。我使用FileInputFormat.setInputPaths(conf,new Path(args [0]);它是args [0],并且它之后我应该替换多个目录部分? – JudyJiang 2013-05-08 18:22:53