0
我正在使用flume-ng及其HDFS接收器。现在,如果我将一些文件添加到给定的文件夹中,它也会自动存储在HDFS中。它工作正常;但是我注意到HDFS中文件的大小非常小。因此,如果我将1GB文件放入指定文件夹,它将以数百个文件存储在HDFS中。我可以让HDFS中的文件更大吗?我如何在flume-conf.properties中配置它?Apache Flume文件大小
我正在使用flume-ng及其HDFS接收器。现在,如果我将一些文件添加到给定的文件夹中,它也会自动存储在HDFS中。它工作正常;但是我注意到HDFS中文件的大小非常小。因此,如果我将1GB文件放入指定文件夹,它将以数百个文件存储在HDFS中。我可以让HDFS中的文件更大吗?我如何在flume-conf.properties中配置它?Apache Flume文件大小
您是否尝试增加hdfs.rollSize
。
有一个开放的jira,将有助于增加hdfs块大小https://issues.apache.org/jira/browse/FLUME-2003