0
A
回答
0
我不知道你使用的Spark是在Azure上还是在本地。所以他们是两种情况,但类似。
要在本地运行的火花,有一个官方blog,介绍如何从星火访问Azure的Blob存储。关键是您需要在
core-site.xml
文件中将Azure存储帐户配置为HDFS兼容存储,并将两个罐子hadoop-azure
&azure-storage
添加到您的类路径中,以便通过协议wasb[s]
访问HDFS。您可以参考官方的tutorial来了解HDFS兼容存储与和blog关于HDInsight配置的更多详细信息。对于在Azure上运行的Spark,区别仅在于使用访问HDFS,其他准备工作是在使用Spark创建HDInsight群集时由Azure完成的。
的方法列出文件是listFiles
或SparkContext
wholeTextFiles
。
希望它有帮助。
相关问题
- 1. 如何从Azure blob容器获取所有/某些文件(CloudBlockBlob)?
- 2. 如何使用Java从azure blob获取特定文件的属性?
- 3. 如何使用Azure存储模拟器blob端点获取blob?
- 4. 从Azure Blob存储使用ascx文件
- 5. 使用VB.NET获取Azure blob上的容器列表
- 6. 从Azure blob存储中读取文件
- 7. Azure Blob存储列表Blob
- 8. 如何使用git2go/libgit2从blob获取实际文件?
- 9. Put /使用Android在Azure上获取BLOB
- 10. 如何获取Azure Blob存储的缩略图PDF文件
- 11. 无法从azure blob容器获取文件名
- 12. 获取从Azure Blob修改的最新文件
- 13. 从azure blob存储内存流中获取wave文件
- 14. 从MapReduce获取Azure Blob路径
- 15. 如何从Azure启动任务中的blob存储获取副本文件?
- 16. 如何使用LINQ从XML文件获取完整列表?
- 17. 如何在使用blob时获取azure blob的更新副本状态StartCopyAsync
- 18. C#从Azure中检索blob列表
- 19. Node.js Azure OCR - 使用本地文件(blob)
- 20. 我如何直接从URL到Azure Blob获取数据
- 21. Umbraco/Azure Blob列表缓存
- 22. 如何使用javascript获取文件夹中的文件列表
- 23. Azure Blob:获取C中的阻止列表#
- 24. 通过REST获取更优化的Azure Blob列表
- 25. 无法使列表blob请求(Windows Azure)?
- 26. 从Azure Blob存储下载文件
- 27. 使用Blob从数据库获取文件
- 28. 如何使用PHP从MySQL列出blob文件?
- 29. 如何从文件列表中获取文件名
- 30. 如何从文件夹结构中获取文件列表