目前我使用的是Cloudera的Hadoop的单节点集群(启用了Kerberos)。火花提交--proxy用户不纱线集群模式下工作
在客户端模式,我用下面的命令
kinit
spark-submit --master yarn-client --proxy-user cloudera examples/src/main/python/pi.py
这工作正常。在集群模式下我用下面的命令(没有做的kinit没有TGT是存在于高速缓存)
spark-submit --principal <myprinc> --keytab <KT location> --master yarn-cluster examples/src/main/python/pi.py
也能正常工作。但是当我使用群集模式下面的命令(不使用kinit完成,没有TGT在高速缓存中存在)
spark-submit --principal <myprinc> --keytab <KT location> --master yarn-cluster --proxy-user <proxy-user> examples/src/main/python/pi.py
抛出以下错误
<proxy-user> tries to renew a token with renewer <myprinc>
我想在集群模式下的火花提交不在客户端机器中查找TGT ...将“keytab”文件传输到集群,然后启动spark任务。那么为什么指定“--proxy-user”选项在“yarn-cluster”模式下提交时查找TGT。难道我做错了什么。
嗨,你有没有找到解决方案? – Benjamin
@Benjamin。唯一的解决办法是修改火花代码,这是一个巨大的痛苦。 –