0
我试图用火花提交,因为这长期运行的火花提交工作
spark-submit -v \
--master yarn \
--num-executors 80 \
--driver-memory 10g \
--executor-memory 10g \
--executor-cores 5 \
--class cosineSimillarity jobs-1.0.jar
这个脚本是在60K记录实施点心算法运行的脚本。
不幸的是这也继续3小时后。 我累了1K的数据,并在2分钟内成功运行。
任何人都可以推荐任何更改spark-submit params使其更快?
检查星火网页UI图,也许你有不好的平行主义 - 那么“重新分配”将会有所帮助 –