2016-11-07 91 views

回答

2

总之,作业执行时间是挂钟时间

这意味着时间仍然是测量,而阶段实际上并没有计算,集群可能是忙着做的之间的任何东西你的工作的各个阶段

这也可能工作在相反的方向:虽然多个阶段并行执行,阶段执行时间的总和可能会大于作业执行时间。

+0

如果数据库读取操作位于spark任务中,是获取计算的所有数据还是不在阶段持续时间中所需的时间? – guilhermecgs