我想知道是否有可能根据文件数量来判断使用的mappers/reducer的数量(默认情况下)?是否可以根据文件数来判断使用的映射器/缩减器的数量?
我知道mapper的数量取决于块的大小,而不是实际的文件大小,但要确保如果我在那里丢失任何东西。
对于前:
如果有4个目录以在其中4个文件HDFS。
dir1/file1 - contains (testing file 1, testing again)
dir2/file2 - contains (testing file 2, testing again)
dir3/file3 - contains (testing file 3, testing again)
dir4/file4 - contains (testing file 4, testing again)
有没有办法告诉多少映射器和减压器将用于处理上述四个文件?
因此,如果我不设置任何减速器的值,将为4个映射器调用多少个减速器?默认情况下是1? – Learner
用默认值和其他相关信息更新了答案。是的,如果你没有明确设置,那么它会是1 – dpsdce