5
我读Hadoop in Action,发现在Java
使用MultipleOutputFormat
和MultipleOutputs
类我们可以减少数据到多个文件,但我不知道如何使用Python streaming
实现相同的目的。Python流:如何减少到多个输出?(它可能与Java虽然)
例如:
/out1/part-0000
mapper -> reducer
\ out2/part-0000
如果有人知道,听说过,做过类似的事情,请让我知道
我该如何使用它?只需下载jar文件,给“-libjar feathers.jar”而不影响我直到现在写的任何map/reduce工作?我可以参考的任何示例测试代码都是有用的 – daydreamer