这听起来很基本,但这个问题困扰了我一段时间。Hive由vs分配而没有分配
可以说我有以下查询
SELECT s.ymd, s.symbol, s.price_close FROM stocks s
SORT BY s.symbol ASC;
在这种情况下,如果数据对符号列很好的传播的话很有道理分配基于符号列,使所有减速获得良好的份额的数据;更改查询到下面会给一个更好的性能
SELECT s.ymd, s.symbol, s.price_close FROM stocks s
DISTRIBUTE BY s.symbol
SORT BY s.symbol ASC, s.ymd ASC;
是什么,如果我不指定by子句分配的效果?在第一个查询中选择的默认地图输出关键字列是什么,即它的分布列是什么?
问题在于未指定分配列时发生的情况。减速机的关键是什么? – learninghuman