2016-07-12 139 views
0

在HIVE中,我尝试获取2种方法中不同行的计数,SQL/HIVE - 区别计数查询 - SELECT COUNT(DISTINCT列,..)与SELECT COUNT(*)如何区别DISTINCT记录的子查询

  1. ​​

  2. SELECT COUNT (DISTINCT columns) FROM table;

两者都得到不同的结果。 第一个查询的计数大于第二个查询。 他们是如何工作不同? 在此先感谢。

+0

什么版本的蜂巢您使用的是?你在使用Impala吗?而且,结果有多不同? –

+0

你的第一条命令在Hive中给了我ParseException。它应该以“作为temp_table_name”结束吗? – daemon12

回答

0

做你的查询略有变化,即命名为如您的子查询:

SELECT COUNT (*) FROM (SELECT DISTINCT columns FROM table) myquery; 
+0

与代码格式一起解释将使您的答案更好。 – Sid