-4
我读蜂房表,做一个简单的sum(field1)
上表中的字段之一,然后通过做.show()
星火优化
表有近1200万行,它正在采取18secs运行执行播放功能在YARN工作。在SQL Server上,相同的功能需要少于10秒。
关于如何优化Spark上查询的想法?
我读蜂房表,做一个简单的sum(field1)
上表中的字段之一,然后通过做.show()
星火优化
表有近1200万行,它正在采取18secs运行执行播放功能在YARN工作。在SQL Server上,相同的功能需要少于10秒。
关于如何优化Spark上查询的想法?
基于对这个问题的信息很难告诉查询是否可以优化:
据将由Sams的Apache Spark在24小时,第24章的火花性能取决于以下几个因素:
您是否将Spark应用程序提交给YARN群集? – 030