1
我有一个关于在黑斑羚数据局部性问题, 可以说我有10个数据节点的集群(每个数据节点上有impalad), 如果我在黑斑羚SELECT * FROM big_table where dt='2017' where blabla orderby blabla group by blabla
执行查询(可以说,它是一个大的查询)。帕拉数据局部性
,并让说,在分区中的文件(DT = 2017' 年)是DN 1,3,5 所以如果我执行查询将协调只能使用数据局部性或者守护进程1,3,5将使用所有的守护进程,其他守护进程将远程读取这些数据?