2013-04-23 22 views

回答

0

可能不会。例如见:https://groups.google.com/a/cloudera.org/forum/?fromgroups=#!topic/cdh-user/AUUZ0DKiJGw

你可以做的是有一个输入数据是文件名本身(无论是在S3或HDFS)。 Hadoop流式处理脚本将获取文件名作为输入,它可以打开并处理它认为合适的文件。

+0

我曾尝试自己。输入二进制文件是可以的,但二进制文件将被分割成几个较小的文件并加载。 – kururu 2013-05-02 08:31:53