摘要:我可以指定在使用hadoop流写入后,在每个输出文件上执行一些操作吗?Hadoop:写入后修改输出文件
基本上,这是Easiest efficient way to zip output of hadoop mapreduce的后续问题。我想将其中的每个键X
的值写入X.txt
文件,压缩成X.zip
存档。但是,当我们编写zip输出流时,很难说明关键字或结果文件的名称,因此我们最终以X.zip
归档文件包含default-name.txt
。
这将是一个非常简单的操作来重命名存档内容,但我可以在哪里放置它?我不想做的就是从S3下载所有的zip文件,然后重新上传。