我有两个Hive表,我试图加入他们两个。表格不是由任何字段聚集或分区的。尽管这些表包含公用密钥字段的记录,但连接查询始终返回0个记录。所有的数据类型都是'字符串'数据类型。Hive加入返回零记录
连接查询简单,看起来像下面
select count(*) cnt
from
fsr.xref_1 A join
fsr.ipfile_1 B
on
(
A.co_no = B.co_no
)
;
任何想法可能是什么回事?我在这两个表中只有一条记录(相同的值)。
下面是
CREATE TABLE xref_1
(
co_no string
)
clustered by (co_no) sorted by (co_no asc) into 10 buckets
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n'
STORED AS TEXTFILE;
CREATE TABLE ipfile_1
(
co_no string
)
clustered by (co_no) sorted by (co_no asc) into 10 buckets
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n'
STORED AS TEXTFILE;
这应该工作,你可以给一个更完整的例子使用表定义和真实数据? – jkovacs