2012-09-17 34 views
2

假设我有两个文件我想通过不同的格式映射。一个是序列文件,另一个是明文。有没有办法为每一个分别指定一个-inputFormat?还是有什么我应该做的映射通过两个?Hadoop与两个输入格式的流?

回答

0

这是MultipleInputs类的用途。对于您输入MultipleInputs的每个输入:

MultipleInputs.addInputPath(job, inputPath, inputFormatClass, mapperClass);