我想将zip文件中的太多小文件(例如200k文件)从本地机器传输到HDFS。当我解压缩zip文件并将文件传输到HDFS时,需要很长时间。无论如何,我可以将原始zip文件转换为HDFS并将其解压缩到那里?将许多小文件传输到Hadoop文件系统
1
A
回答
0
如果你的文件是GB的,那么这个命令肯定有助于避免空间不足的错误,因为不需要在本地文件系统上解压文件。
将命令放在hadoop支持从stdin读取输入。为了读取stdin的输入,使用' - '作为源文件。
压缩文件名:compressed.tar.gz
gunzip解-c compressed.tar.gz | hadoop fs -put -/user/files/uncompressed_data
只有缺点:这种方法的唯一缺点是在HDFS中,即使本地压缩文件包含多个文件,数据也会合并到单个文件中。
http://bigdatanoob.blogspot.in/2011/07/copy-and-uncompress-file-to-hdfs.html
+1
没错,但我想要HDFS上的单个文件,我不想合并它们。 – Mohsen
相关问题
- 1. 如何将文件(PDF)传输到Hadoop文件系统
- 2. 将文件上传到文件系统
- 3. Hadoop的复制文件到文件系统的Hadoop
- 4. 的Hadoop文件系统是物理文件系统或虚拟文件系统
- 5. Hadoop发行文件系统
- 6. 将数据从HBase迁移到文件系统。 (写Reducer输出到本地或Hadoop文件系统)
- 7. 未找到Hadoop文件系统命令
- 8. Hadoop文件系统统计信息(FileSystem.Statistics)
- 9. 在Hadoop文件系统中的多个文件的grep
- 10. Cordova将文件从输入文件保存到文件系统=“文件”
- 11. 我可以使用Apache NIFI将文件传输到HDFS系统。
- 12. SSIS - 将文件系统部署到文件系统
- 13. 系统允许的最大文件大小是多少?
- 14. 如何将文件从本地文件系统复制到HDFS文件系统?
- 15. 安装的Hadoop文件系统
- 16. 拥有kerberose的Hadoop文件系统
- 17. 本地文件系统上的Hadoop
- 18. hadoop文件系统的解释
- 19. 谷歌的Hadoop文件系统加密
- 20. 关于hadoop文件系统transferFromLocalFile
- 21. 记录Hadoop的文件系统操作
- 22. Hadoop分布式文件系统
- 23. Linux与Hadoop文件系统的区别
- 24. Hadoop的分发文件系统
- 25. 从AWS中删除文件系统 - Hadoop
- 26. 了解Hadoop文件系统计数器
- 27. Hadoop Yarn写入本地文件系统
- 28. Hadoop文件系统副本 - namenode vs datanode
- 29. 需要解释在Hadoop文件系统
- 30. 文件系统块大小
为什么你会更快? –
这需要通过hadoop dfs -put命令从本地计算机传输许多小文件。我收到了一些警告消息,因为它需要很长时间,而且我也会被亚马逊收取更多费用。在同一个文件系统上解压文件应该比从文件系统复制到另一个文件系统要快。 – Mohsen