我看到有hdfs3,毒蛇咬伤等等。哪一个是最好的支持和综合?使用Python3与HDFS交互的最佳模块是什么?
2
A
回答
1
据我所知,并不像人们想象的那样多。但我建议官方Python包hdfs 2.0.12
可在website或从终端运行下载:
pip install hdfs
的一些特点:
- 的Python(2和3)绑定为WebHDFS (和HttpFS)API, 支持安全和不安全的群集。
- 命令行界面 用于传输文件并启动交互式客户端shell,其别名为 ,以实现方便的namenode URL缓存。
- 通过 可选扩展的其他功能:avro,可以直接从 HDFS读取和写入Avro文件。数据帧,以加载和保存熊猫数据框。 Kerberos,到 支持Kerberos认证的集群。
1
我试过蛇咬伤,hdfs3和hdfs。
Snakebite只支持下载(不上传),所以它不适合我。
在这些3只hdfs3的支持HA设置,所以这是我的选择,但我没让它用数据节点的主机名(这里所描述的问题:https://rainerpeter.wordpress.com/2014/02/12/connect-to-hdfs-running-in-ec2-using-public-ip-addresses/)与multihomed networks工作
所以我结束使用hdfs(2.0.16),因为它支持上传。我不得不使用bash添加一些解决方法来支持HA。
PS。有一篇比较有趣的文章比较了为与Hadoop文件系统交互而开发的Python库,文章位于http://wesmckinney.com/blog/python-hdfs-interfaces/
相关问题
- 1. 跨模块使用变量的最佳方法是什么? (Python3)
- 2. 什么是编写和测试交互式python3代码的最佳工具?
- 3. 使用Yii2与外部API进行交互的最佳实践是什么?
- 4. 使用C#4.0与Excel进行交互的最佳方式是什么?
- 5. 处理彼此使用模块的最佳方式是什么?
- 6. 什么是java和javascript交互的最佳方式?
- 7. 交互式数据可视化的最佳语言是什么?
- 8. 调试SOAP交互的最佳方式是什么?
- 9. python中交互式调试的最佳方式是什么?
- 10. 与AmpersandJS一起使用的最佳模板系统是什么?
- 11. 如何使mahout与hadoop HDFS交互
- 12. 什么是显示和与技能树交互的最佳方式
- 13. 与ICQ交互的最佳C++库?
- 14. 什么是引用父/包含nodejs模块的最佳方式?
- 15. 模型与另一个类的模型进行交互时,组织Rspec测试的最佳方法是什么?
- 16. https应该使用什么python web交互模块?
- 17. 什么是与DLL互相沟通的最佳方式
- 18. 什么是可用于将Aramex模块与Magento 1.9.2集成的最佳扩展?
- 19. 与Singleton交互的最有效方式是什么?
- 20. 什么是OCaml中的HttpRequest的最佳模块
- 21. 什么是创建交互式应用程序原型的最佳方式?
- 22. 什么是在用户交互后旋转图像的最佳方式
- 23. 使用现有代码与MySQL交互的网站的最佳方法是什么?
- 24. 什么是创建新游戏的最佳方式! 2.1模块?
- 25. 什么是创建ASP.NET门户和模块的最佳实践?
- 26. 命名空间AMD模块的最佳途径是什么?
- 27. 什么是组织游戏模块的最佳方式
- 28. 什么是lighttpd的最佳缓存模块?
- 29. 什么是node.js的最佳控制流模块?
- 30. 什么是Maven模块命名的最佳实践?