当使用带有NEW API和自定义(java)输出格式或(java)Reducer类未发现问题的Hadoop python流时,会发生类似问题。而旧的API则可以正常工作。使用Hadoop Streaming和New API文件格式时未找到类
即 下面的命令行参数工作文件与旧的API,但有新的API的问题。
-inputformat JavaClassName
-outputformat JavaClassName
-partitioner JavaClassName
-combiner streamingCommand or JavaClassNam
例如,如果你看看这个博客帖子:http://research.neustar.biz/2011/08/30/custom-inputoutput-formats-in-hadoop-streaming/如果你试图用我曾与当地的Hadoop和AWS EMR问题的新MultipleOutputs(减速)来实现这一点。
有什么想法?