2017-03-07 317 views
1

当我试图复制AWS S3桶到HDFS,我发现了错误:错误:权限被拒绝:'/用户

Permission denied: '/user'

下面是我的脚本

aws s3 sync s3://folder1.folder2/file.json /user/hive/warehouse/my.db/json_table 

请帮忙 !

回答

0

S3 sync不识别HDFS路径。

要么使用,

  • hadoop distcp配置后,所有的S3相关properties
  • S3DistCp,这需要s3distcp.jar
  • 如果文件很小,则sync将文件保存到localpath,copyFromLocal保存到HDFS。
+0

我一直在使用'sync',但如果使用'S3Distcp',我可以减少将数据从S3移动到HDFS的步骤。我没有安装s3distcp jar,但它给我一个错误。 – GOU7HAM

+0

如果您拥有'AWS_ACCESS_KEY'和'AWS_SECRET_ACCESS_KEY',则可以使用Distcp本身。关于's3distcp'的错误,您可以在发布整个堆栈跟踪时打开一个新问题。 – franklinsijo