0
A
回答
0
我使用java来处理gzip文件并以gzip压缩方式生成输出。我用下面的代码
FileOutputFormat.setCompressOutput(job, true);
FileOutputFormat.setOutputCompressorClass(job, GzipCodec.class);
FileOutputFormat.setOutputPath(job, output path));
我希望你会发现类似的API /代码在Python中。
您可以生成gzip文件作为生成的输出。通过'-D mapred.output.compress = true -D mapred.output.compression.codec = org.apache.hadoop.io.compress.GzipCodec'作为您的流式作业的选项。
相关问题
- 1. 压缩输入流Java
- 2. 输出压缩HTML
- 3. SPHINX输出压缩?
- 4. 使用g4压缩压缩输出tiff
- 5. 如何从流式Hadoop作业获取压缩(文本)输出
- 6. C中的流媒体压缩库用于流式传输
- 7. 使用输入/输出流的Java LZ4压缩
- 8. 压缩到流
- 9. 压缩流
- 10. 使用GZip压缩输出
- 11. 压缩和解压流
- 12. 解压缩或膨胀php://输入流?
- 13. 获取压缩文件的输入流?
- 14. 解压缩trunctated压缩流(放气)
- 15. 使用Compression.DeflateStream压缩和解压缩流
- 16. JavaScript:数据流压缩/解压缩
- 17. 的YUICompressor - 压缩多输入多输出
- 18. 解压缩GZIP流
- 19. 如何压缩流?
- 20. 流的Delta压缩
- 21. 错误压缩流
- 22. 快速压缩流式图像
- 23. 压缩文件的仅内存流式传输
- 24. YUI压缩机 - 压缩多个输入文件到一个输出文件
- 25. 查找压缩文件和输出行
- 26. 批处理:REG的输出压缩
- 27. 如何压缩MapReducer的输出?
- 28. 星火未压缩JSON输出
- 29. 基于JEKYLL_ENV压缩SASS输出?
- 30. Parquet输出文件不压缩