2017-05-15 53 views
1

要重写这个问题是因为我收到了很多更新的信息。亚马逊EMR - Yum更新Boostrap操作在Slave上失败

我的问题是:

我有1个主节点和1个从节点的集群EMR。从节点配置为可以不受限制地访问开放的互联网(我知道这是一个安全风险)。

当我建立这个集群的引导作用,这只是调用sudo yum -y update,它失败了,说,引导作用的从属节点上(它总是成功的上主)失败

但是,如果SSH到从节点并手动尝试执行sudo yum -y update,该操作在5.5.0 EMR软件包上成功完成。

我无法进一步调试为什么发生这种情况,因为尽管依据我的最佳知识正确配置了它,但EMR不会将任何日志复制到S3(日志复制最多只有零星),并且CloudWatch不会收到任何来自VPC的日志,这使得调试这个问题很模糊。

任何信息将不胜感激。

编辑︰我能够让我的CloudWatch VPC日志工作(显然我的IAM没有信任关系上传日志),它显示了很多REJECTs,而主节点似乎并没有显示任何拒绝。这使我认为有一些自动配置正在进行,并阻止我正确下载yum软件包?

回答

0

在提出模糊问题和设法自己解决问题的传统中,让我分享一下我的缓解。

原来这是EMR-5.5.0发行标签中的一个问题。降级到EMR-5.3.0修复了我的脚本问题,现在脚本按预期正常执行。

脚本执行的时间/方式似乎有可能在5.5.0中发生变化。