我需要将大量文件从一个hdfs目录移动到另一个hdfs目录中(而不是复制)到另一个hdfs目录。将大量文件从hdfs移动到hdfs
我可以使用distcp,但它似乎是一个矫枉过正,因为它是复制文件(复制它)我只想移动它。两个问题:
A)是那里有什么:
我想用MapReduce的做到这一点,因为有成千上万的文件需要被移动(或重命名为新的路径)。我也想将它与oozie集成。我自己可以写一个mapreduce工作,但我想知道是否有什么可以完成这项工作。
B)我真的需要这样做mapred?
不幸的是,我对hdfs rename的性能特征不够了解;你认为我可以通过单线程方法来重命名文件吗?