有没有办法直接使用HDFS路径从HDFS读取任何文件格式,而不必从HDFS本地读取文件并读取它。直接从HDFS读取文件
1
A
回答
2
你必须拉整个文件。无论您使用的是cat
还是text
命令,整个文件仍将流式传输到您的shell。命令结束时只剩下文件的剩余部分。所以,如果你计划几次检查文件,最好get
它
作为一个hdfs客户端,你必须联系namenode获取特定文件的所有块位置。
1
可以与HDFS DFS尝试-cat
用法:HDFS DFS -cat [-ignoreCrc] URI [URI ...]
hdfs dfs -cat /your/path
2
您可以在HDFS使用cat
命令来读取正规文本文件。
hdfs dfs -cat /path/to/file.csv
读取压缩文件一样gz, bz2
等,你可以使用:
hdfs dfs -text /path/to/file.gz
这些都是Hadoop的原生支持使用FsShell
comamnds两种读法。对于其他复杂文件类型,您将不得不使用更复杂的方式,例如Java程序或其他类似的东西。
2
HDFS DFS - 猫/路径或Hadoop的FS - 猫/路径
相关问题
- 1. 直接从HDFS读取文件到shell函数中
- 2. 能否直接读取存储在HDFS中的文件?
- 3. 直接从zip中读取HTML文件
- 4. 从HDFS读取简单的Avro文件
- 5. 如何从hdfs读取文件
- 6. 从pyspark读取hdfs中的文件
- 7. 从HDFS读取文件时出现MalformedURLException
- 8. 无法从HDFS读取文件
- 9. 从远程HDFS读取文件
- 10. 如何强制直接从HDFS读取Apache Mahout应用程序
- 11. 读入csv文件从HDFS
- 12. 使用HDFS从HDFS读取文件Java API
- 13. 在HDFS中直接生成文件
- 14. 直接从csv读取var
- 15. 如何直接读取dbf/dbt文件?
- 16. 在Java中读取一个文件hdfs
- 17. 在eclipse中读取HDFS文件
- 18. 直接HDFS访问
- 19. 从文件中读取直到EOF
- 20. 使用pyspark直接从网站读取json文件
- 21. 无法直接从使用javascript的路径读取excel文件
- 22. 骆驼从直接读取文件和过程
- 23. 如何直接从网页读取/写入本地文件(html)
- 24. C库直接从文件流中读取和解析JSON
- 25. 在C++中直接从文件读取数据到RAM
- 26. 直接从Python网站读取csv文件3
- 27. 从文件读取整数值并直接输入到程序
- 28. 如何直接从服务器与Python读取Excel文件
- 29. 直接向/从内存读取/写入Excel文件
- 30. 直接从文件中读取大量bmp数据
标记为答案,因为它致意所有其他的答案 – Newb101