2014-02-27 31 views
0

我正在使用新的Hadoop API,因为没有办法明确指定映射器的数量(与旧API不同),所以我需要更改数据块的大小,以便可以控制映射器的数量。如何更改代码中数据拆分的默认大小?如何更改Hadoop中数据块的大小?

+1

http://stackoverflow.com/questions/2669800/changing-the-block-size-of-a-dfs-file-in-hadoop可能有帮助 – michaeltang

+0

我不认为你可以在旧的API,无论是。 – vefthym

回答

0

映射器的数量由(文件)分割确定
分割大小由正在使用的InputFormat确定。
mapred.max.split.size参数将允许您定义拆分大小。