1
我想修改输入文件被拆分成块并存储在Hadoop分布式文件系统中的方式(例如,它根据块大小拆分文件,但我的应用程序需要根据文件内容)。 所以我想知道正确的分类文件分为基于块大小HADOOP属性的类。Hadoop发行文件系统
我想修改输入文件被拆分成块并存储在Hadoop分布式文件系统中的方式(例如,它根据块大小拆分文件,但我的应用程序需要根据文件内容)。 所以我想知道正确的分类文件分为基于块大小HADOOP属性的类。Hadoop发行文件系统
谢谢Praveen。我打算修改hadoop源代码。所以我想知道如何控制从一个类到另一个hdfs流。
我想知道以下内容: -
1.在命令提示符中使用CopyFromLocal命令将文件复制到hdfs时调用的类。
2.为实现Mapper接口的类创建对象的类。
3.将类分配给ReplicationTargetChooser类中的chooseTarget()函数返回的datanodes列表(DatanodeDescriptor数组)的类。 – user1938899