从官方火花文档(http://spark.apache.org/docs/1.2.0/running-on-yarn.html):火花客户端重新连接到YARN簇
在纱线群集模式,所述火花驱动器,其是由纱线所管理的簇上的应用程序的主进程中运行,并且客户端可以在启动应用程序后离开。
有没有一种方式,客户在某个时候重新连接回司机后来收集的结果?
从官方火花文档(http://spark.apache.org/docs/1.2.0/running-on-yarn.html):火花客户端重新连接到YARN簇
在纱线群集模式,所述火花驱动器,其是由纱线所管理的簇上的应用程序的主进程中运行,并且客户端可以在启动应用程序后离开。
有没有一种方式,客户在某个时候重新连接回司机后来收集的结果?
没有简单的方法,我知道的。
从广义上讲,纱群集模式是有道理的生产岗位,而纱线的客户端模式是有道理的,互动和调试使用要立即看到您的应用程序的输出。
在生产作业时,最简单的也许是让你的驾驶船的结果某处一旦他们(例如它们写入HDFS,记录......)。
通常你可以用
yarn logs -applicationId <app ID>
检查https://spark.apache.org/docs/2.2.0/running-on-yarn.html
检查日志如果日志聚集打开(与yarn.log聚集启用 配置),容器日志复制到HDFS并在本地 机器上删除。这些日志可以在集群中的任何位置使用 yarn logs命令查看。
yarn logs -applicationId <app ID>
将从 打印出所有的日志文件的内容从所有容器中给定的应用