1
我是假设,谷歌存储连接器将允许查询GS直接,如果它是HDFS从Dataproc星火,但它看起来像下面没有(从星火壳牌)工作:如何从Spark Dataproc检查Google存储中是否存在文件?
是否有仅使用Hadoop API访问Google Storage文件的方式?
我是假设,谷歌存储连接器将允许查询GS直接,如果它是HDFS从Dataproc星火,但它看起来像下面没有(从星火壳牌)工作:如何从Spark Dataproc检查Google存储中是否存在文件?
是否有仅使用Hadoop API访问Google Storage文件的方式?
这是因为FileSystem.get(...)
返回默认FileSystem
根据您的配置是HDFS
,并且只能使用从hdfs://
开始的路径。使用以下来获得正确的FS。
Path p = new Path("gs://...");
FileSystem fs = p.getFileSystem(...);
fs.exists(p);
谢谢,它只是通过获取文件系统像这样:'path.getFileSystem(sc.hadoopConfiguration)'' –