2
假设我有两个文件我想通过不同的格式映射。一个是序列文件,另一个是明文。有没有办法为每一个分别指定一个-inputFormat
?还是有什么我应该做的映射通过两个?Hadoop与两个输入格式的流?
假设我有两个文件我想通过不同的格式映射。一个是序列文件,另一个是明文。有没有办法为每一个分别指定一个-inputFormat
?还是有什么我应该做的映射通过两个?Hadoop与两个输入格式的流?
这是MultipleInputs类的用途。对于您输入MultipleInputs的每个输入:
MultipleInputs.addInputPath(job, inputPath, inputFormatClass, mapperClass);